Волна ИИПодписаться
← Назад
Модели и агенты

Gemini 3.5 Flash получил компьютерное зрение: модель Google сама управляет экраном

25.06.2026 · the-decoder.com ↗
Gemini 3.5 Flash получил компьютерное зрение: модель Google сама управляет экраном

Google DeepMind добавил в Gemini 3.5 Flash встроенный режим Computer Use — модель может самостоятельно управлять компьютером, браузером и мобильными устройствами. Она видит экран, распознаёт интерфейс и выполняет действия: кликает, вводит текст, навигирует по меню.

На бенчмарке OSWorld, который измеряет способность ИИ работать с реальными приложениями, Gemini 3.5 Flash показала результат 78,4 — это сравнимый с GPT-5.5 показатель. Разработчики уже могут использовать Gemini API для создания агентов автоматизации: от тестирования ПО до офисных рутин.

В отличие от предыдущих версий, модель не требует дополнительных фреймворков или обвязки — Computer Use работает прямо из коробки, как часть базовой функциональности Gemini 3.5 Flash. Это делает её одним из самых доступных инструментов для создания ИИ-агентов, способных работать с любым программным обеспечением.

Источник: the-decoder.com
← Все новости AI Wave