1 Introduction
La réduction de dimensionnalité regroupe un ensemble de techniques statistiques et d’apprentissage automatique visant à diminuer le nombre de variables (ou caractéristiques) d’un jeu de données. L’objectif principal est de conserver l’information la plus pertinente possible tout en simplifiant la structure des données.
Cela permet notamment de : * Visualiser plus facilement des données de haute dimension. * Réduire la complexité des modèles et les temps d’entraînement. * Atténuer le “fléau de la dimensionnalité” et améliorer la généralisation des modèles. * Éliminer la redondance et le bruit dans les données.
Explorez ci-dessous les différentes méthodes et algorithmes que nous aborderons :