Волна ИИПодписаться
← Назад
Инструменты

WebBrain: опенсорс-ный AI-агент для браузера, который работает локально и понимает пять языков

03.07.2026 · marktechpost.com ↗

Браузерный AI-агент WebBrain от Эмре Сокуллу работает в боковой панели браузера. В Chrome используется Manifest V3 и sidePanel API, в Firefox — Manifest V2 и sidebar_action. Каждая вкладка хранит свою историю диалога. Расширение работает внутри существующей аутентифицированной сессии: видит ваши учётные записи так же, как вы, и не хранит данные вне браузера. Никакой телеметрии и учётных записей.

У WebBrain два режима. Ask mode — только чтение без изменений страницы. Act mode позволяет кликать, печатать, скроллить, переходить по ссылкам и выполнять сценарии. В Act mode управление страницей идёт через Chrome DevTools Protocol (API chrome.debugger), что даёт доступ к кросс-доменным iframe и shadow DOM, недоступным обычным скриптам. Отладчик подключается только по необходимости. В Firefox Act mode работает слабее из-за отсутствия CDP.

Безопасность продумана: агент стартует в режиме только для чтения и спрашивает перед опасными действиями. Для создания, отправки и покупки используется только видимый UI — REST или GraphQL напрямую не вызываются. Чтение (README, цены) использует фоновый HTTP через инструменты fetch_url и research_url. Для экономии токенов скриншоты сжимаются JPEG-компрессией, история диалога обрезается, а планирование можно поручить дешёвой текстовой модели, оставив зрение для скриншотов.

WebBrain поддерживает английский, испанский, французский, турецкий и китайский, язык определяется автоматически. Температуры фиксированы: Act mode — 0.15, Ask mode — 0.3, vision — 0. Код распространяется под лицензией MIT на GitHub.

Источник: marktechpost.com
← Все новости AI Wave