Волна ИИПодписаться
← Назад
Инструменты

BERT-фильтр спама на почте: 550 МБ RAM и 100 мс на проверку

04.07.2026 · habr.com ↗

Стандартные фильтры Яндекса, Mail и SpamAssassin не справляются с потоком спама и рекламы, особенно с письмами, которые формально не нарушают правила — приглашения, партнёрки, кредитные предложения. Байесовские фильтры такие вещи пропускают.

Автор поставил на сервер локальную BERT-модель ruBert-base-antispam с HuggingFace. Это файн-тюн DeepPavlov/rubert-base-cased-conversational: 177 млн параметров, 12 слоёв, 768 hidden size, до 512 токенов на вход. Модель потребляет около 550 МБ RAM и выдаёт бинарный ответ (спам/не спам) за 100–200 мс без промптов и reasoning.

Источник: habr.com
← Все новости AI Wave