Новые Claude Opus 4.8 и Sonnet 5 испортили совместимость со сторонними инструментами — парадокс ИИ
Разработчик Armin Ronacher обнаружил странную проблему при работе с Pi: новые модели Claude (Opus 4.8 и Sonnet 5) иногда вызывают edit-инструмент с дополнительными, несуществующими полями в массиве edits[]. При этом сам результат редактирования обычно корректен, но аргументы не соответствуют схеме — Pi отклоняет вызов и просит повторить. Старые модели такой проблемы не показывают.
Самое удивительное, что это регрессия: более новые SOTA-модели Anthropic ведут себя хуже, чем их предшественники. Армин предполагает, что Anthropic через Reinforcement Learning обучила модели более эффективно использовать собственные edit-инструменты, встроенные в Claude Code. Это негативно сказалось на совместимости со сторонними инструментами, такими как Pi.
Напомним, что у Claude edit-инструмент основан на поиске и замене, а у OpenAI Codex — на apply_patch. OpenAI целенаправленно тренирует свои модели под свой механизм. Возникает вопрос: следует ли разработчикам сторонних фреймворков реализовывать несколько edit-инструментов, чтобы подбирать оптимальный под конкретную модель пользователя?
Проблема иллюстрирует, как оптимизация под собственный экосистемный инструмент может ухудшить работу с внешними — и это вызов для создателей универсальных AI-агентов.