OpenAI представила LifeSciBench — бенчмарк для ИИ в науках о жизни, написанный экспертами
OpenAI анонсировала LifeSciBench — новый бенчмарк для оценки того, насколько хорошо модели ИИ работают с реальными исследовательскими задачами и принятием решений в науках о жизни. Ключевая особенность: все задания написаны и проверены учёными-экспертами, а не автоматически сгенерированы.
Бенчмарк охватывает сценарии, с которыми сталкиваются исследователи жизни: от интерпретации биологических данных до планирования экспериментов. Это шаг к тому, чтобы ИИ перестал быть просто «угадайкой» и начал демонстрировать практическую пригодность в лабораториях и клиниках.
Набор тестов уже доступен для публичного тестирования. Разработчики смогут проверить свои модели на реалистичных задачах, а сообщество — увидеть, где ИИ действительно может помогать учёным, а где пока проседает.