Белый дом не смог взломать Claude: эксперт объяснила, почему Fable отказалась искать уязвимости
Кэти Муссурис, CEO Luta Security и известный эксперт по кибербезопасности, рассказала The Atlantic, что Anthropic поделилась с ней копией отчёта Белого дома, посвящённого попытке джейлбрейка модели Fable. Отчёт, по её словам, описывает эксперимент, в котором ИТ-специалисты просили Fable помочь найти и исправить баги в коде.
Когда модели дали заведомо небезопасный код, она отказалась выполнять запрос «проверь код на уязвимости», но согласилась на команду «исправь этот код» после нескольких ручных подсказок. Муссурис подчеркнула, что это не взлом, а «работа модели в штатном режиме» для киберзащиты: Fable корректно отклонила опасный запрос и выполнила разрешённый.
Таким образом, инцидент выглядит не как уязвимость модели, а скорее как неудачная попытка политического давления на Anthropic со стороны администрации. Белый дом требовал заблокировать Fable и Mythos, ссылаясь на угрозу кибератак, но экспертный анализ показывает — никакого реального джейлбрейка не было.
История уже обросла политическим контекстом: отключение моделей Anthropic по всему миру вызвало протесты среди специалистов по кибербезопасности, которые называют запрет «опасным для обороны» и необоснованным с технической точки зрения.