
1 Introduction
Ce questionnaire évalue votre compréhension des différents modèles de régression et des concepts clés associés, de la régression linéaire aux méthodes ensemblistes. Pour chaque question, cochez la case correspondant à la réponse la plus correcte.
2 Questions
En régression linéaire multiple, comment interprète-t-on un coefficient β j =50 pour une variable surface (en m²) pour prédire un prix ?
Parmi les affirmations suivantes sur les hypothèses de la régression linéaire (concernant les erreurs), laquelle est FAUSSE ?
Pourquoi préfère-t-on souvent le R² ajusté au R² standard pour comparer des modèles ?
Quelle est la principale différence entre la régression Ridge (L2) et la régression Lasso (L1) ?
Comment un modèle de régression k-NN fait-il une prédiction pour une nouvelle observation ?
Dans un graphique de diagnostic des résidus, vous observez que le nuage de points “Résidus vs. Valeurs Prédites” a une forme de cône (la dispersion augmente avec les valeurs prédites). Qu’est-ce que cela indique ?
Comment intègre-t-on une variable catégorielle comme ville (‘Paris’, ‘Lyon’, ‘Marseille’) dans un modèle de régression linéaire ?
Quel est le principal avantage d’une Forêt Aléatoire (Random Forest) par rapport à un unique Arbre de Décision en régression ?
Vous voulez modéliser une relation qui ressemble à une parabole entre une variable X et votre cible Y. Comment pouvez-vous adapter votre modèle de régression linéaire ?
Lors de l’élagage (pruning) d’un arbre de décision, quel est l’objectif principal ?