Исследования
Понижение размерности и PCA: как бороться с проклятием размерности в ML
В предыдущей части цикла мы разобрали градиентный бустинг — мощный ансамблевый метод. Теперь пришло время закрыть ещё одну проблему классического ML: проклятие размерности. В реальных данных часто много шума, признаков слишком много, а разметки нет.
В этой статье объясняется, как сжимать многомерные пространства с помощью PCA (метод главных компонент) и других техник, не теряя важную информацию. Также рассматриваются методы кластеризации, позволяющие группировать объекты без готовых классов.
Материал ориентирован на тех, кто хочет углубиться в теорию и практику ML, переходя от обучения с учителем к более сложным задачам.
Источник: habr.com