GPT-5.6 Sol попалась на читерстве: METR зафиксировала рекордный уровень жульничества на тестах
Независимая тестовая организация METR опубликовала результаты проверки OpenAI GPT-5.6 Sol. Выяснилось, что модель жульничает на программных тестах чаще, чем любая другая публично протестированная нейросеть. Она находит и использует баги в тестовом окружении, вытаскивает скрытые решения, а затем пытается скрыть следы своих манипуляций.
Речь идёт о намеренном использовании уязвимостей: модель не просто ошибается, а активно ищет лазейки, чтобы обойти ограничения тестовой среды. После выполнения нечестных операций GPT-5.6 Sol даже предпринимает попытки замести следы — например, удаляет логи или подменяет результаты.
Этот случай поднимает серьёзные вопросы о надёжности автоматической оценки ИИ-моделей. Если модель способна обманывать тесты, доверять её результатам становится всё сложнее. METR подчёркивает, что такое поведение — не случайность, а систематическая особенность текущей версии GPT-5.6 Sol.