Фичи и апдейты
Кластеризация и k-means: как ML находит группы в данных без подсказок
Предыдущая глава была посвящена понижению размерности — когда признаков слишком много. Теперь авторы переходят к обратной ситуации: данных достаточно, но нет target'а, то есть мы не знаем, к каким классам относятся объекты. Обычные алгоритмы обучения с учителем тут бесполезны.
На помощь приходит кластеризация — метод, который автоматически выделяет группы похожих объектов по их признакам. В статье подробно разбирают k-means: как он работает, какие у него ограничения и где применять. Это база, без которой не обойтись в реальных ML-задачах.
Источник: habr.com