Тесты и бенчмарки

OpenAI представила LifeSciBench — бенчмарк для ИИ в науках о жизни, написанный экспертами

17.06.2026 · openai.com ↗

OpenAI анонсировала LifeSciBench — новый бенчмарк для оценки того, насколько хорошо модели ИИ работают с реальными исследовательскими задачами и принятием решений в науках о жизни. Ключевая особенность: все задания написаны и проверены учёными-экспертами, а не автоматически сгенерированы.

Бенчмарк охватывает сценарии, с которыми сталкиваются исследователи жизни: от интерпретации биологических данных до планирования экспериментов. Это шаг к тому, чтобы ИИ перестал быть просто «угадайкой» и начал демонстрировать практическую пригодность в лабораториях и клиниках.

Набор тестов уже доступен для публичного тестирования. Разработчики смогут проверить свои модели на реалистичных задачах, а сообщество — увидеть, где ИИ действительно может помогать учёным, а где пока проседает.

Источник: openai.com

Темы: Тесты и бенчмарки Openai