Фичи и апдейты

Кластеризация и k-means: как ML находит группы в данных без подсказок

03.07.2026 · habr.com ↗

Предыдущая глава была посвящена понижению размерности — когда признаков слишком много. Теперь авторы переходят к обратной ситуации: данных достаточно, но нет target'а, то есть мы не знаем, к каким классам относятся объекты. Обычные алгоритмы обучения с учителем тут бесполезны.

На помощь приходит кластеризация — метод, который автоматически выделяет группы похожих объектов по их признакам. В статье подробно разбирают k-means: как он работает, какие у него ограничения и где применять. Это база, без которой не обойтись в реальных ML-задачах.

Источник: habr.com

Темы: Фичи и апдейты