Gemini 3.5 Flash получил компьютерное зрение: модель Google сама управляет экраном
Google DeepMind добавил в Gemini 3.5 Flash встроенный режим Computer Use — модель может самостоятельно управлять компьютером, браузером и мобильными устройствами. Она видит экран, распознаёт интерфейс и выполняет действия: кликает, вводит текст, навигирует по меню.
На бенчмарке OSWorld, который измеряет способность ИИ работать с реальными приложениями, Gemini 3.5 Flash показала результат 78,4 — это сравнимый с GPT-5.5 показатель. Разработчики уже могут использовать Gemini API для создания агентов автоматизации: от тестирования ПО до офисных рутин.
В отличие от предыдущих версий, модель не требует дополнительных фреймворков или обвязки — Computer Use работает прямо из коробки, как часть базовой функциональности Gemini 3.5 Flash. Это делает её одним из самых доступных инструментов для создания ИИ-агентов, способных работать с любым программным обеспечением.