
1 Introduction
Ce questionnaire évalue votre compréhension des techniques de clustering, qui visent à découvrir des groupes naturels dans des données non étiquetées. Pour chaque question, cochez la case correspondant à la réponse la plus correcte.
2 Questions
Pourquoi la mise à l’échelle des variables (Feature Scaling) est-elle une étape quasi obligatoire avant d’appliquer des algorithmes comme K-Means ou DBSCAN ?
Comment l’algorithme K-Means assigne-t-il une observation à un cluster ?
Dans la “méthode du coude” utilisée pour choisir le K optimal pour K-Means, que représente le “coude” sur le graphique ?
Vous calculez le score de silhouette moyen pour une solution de clustering et obtenez une valeur de 0.8. Qu’est-ce que cela indique ?
Quel est le principal résultat visuel produit par un algorithme de clustering hiérarchique agglomératif ?
Dans un dendrogramme, comment la hauteur d’une fusion entre deux branches est-elle interprétée ?
Quel est le principal avantage de l’algorithme DBSCAN par rapport à K-Means ?
Dans DBSCAN, que définissent les hyperparamètres eps et min_samples ?
Comment DBSCAN traite-t-il les points qui ne sont ni des “points cœurs” ni des “points de bordure” ?
Vous utilisez le “Adjusted Rand Index” (ARI) pour évaluer votre clustering et obtenez un score de 0.9. Que pouvez-vous en conclure ?