Тесты и бенчмарки
Новый бенчмарк от Института эстонского языка проверит LLM на устойчивость к российской пропаганде
Институт эстонского языка представил специализированный бенчмарк, предназначенный для измерения того, насколько легко языковые модели ИИ поддаются влиянию российской пропаганды.
Тест позволяет оценить устойчивость LLM к дезинформации и манипулятивным нарративам, выявляя слабые места в системах контент-фильтрации и безопасности моделей.
Источник: the-decoder.com