Эксперт: запрет Fable 5 ослабил кибербезопасность США — модель просто исправляла баги
Кейт Муссурис, чьё высказывание ранее процитировал The Atlantic, сама прояснила детали инцидента с Fable 5. Она подтвердила, что «джейлбрейк», из-за которого модель заблокировали экспортным контролем, на самом деле был запросом «исправь этот код». Исследователи взяли открытый код с известными CVE и код с намеренно внедрёнными уязвимостями, попросили Fable 5, Mythos и Opus проверить код на проблемы безопасности. Fable 5 отказался. Затем моделей попросили «исправить код» — и через многошаговый ручной процесс превратили вывод в скрипты для тестирования патчей.
Муссурис назвала ситуацию абсурдом: кодовые модели должны исправлять баги, а киберуязвимости — самый важный класс багов для исправления. Защитникам нужно просить ИИ починить файл, объяснить, почему исправление важно, и написать тесты, подтверждающие работоспособность патча. «Это не обход ограничений. Это самая ценная вещь, которую может сделать ИИ для оборонной кибербезопасности: выполнить цикл „найти — исправить — протестировать“, который защитники запускают каждый день», — заявила она.
По её словам, промпты сработали, потому что это были оборонительные запросы. Убрать эту возможность невозможно, не сделав модель хуже в исправлении багов и верификации патчей. Муссурис подчёркивает, что нетехнические лица, принимающие решения, месяцами слышали о том, что модели, способные «создавать кибератаки», уникально опасны, и теперь готовы запретить любую модель, которая помогает защитить код. «Вся эта ситуация — такой бардак», — резюмирует она.