1 Qu’est-ce que la statistique descriptive ?
La statistique descriptive est une branche des statistiques qui permet de résumer, organiser et interpréter un ensemble de données. Elle est utilisée pour extraire des informations essentielles à partir de grands volumes de données, facilitant ainsi leur compréhension et leur communication.
Elle se distingue de la statistique inférentielle, qui cherche à tirer des conclusions sur une population à partir d’un échantillon. La statistique descriptive, quant à elle, ne fait que décrire et synthétiser les données observées.
Exemples d’application : - Entreprise : Analyse des ventes mensuelles d’un produit. - Recherche scientifique : Étude de la répartition de l’âge dans une population. - Analyse de données : Résumé des notes des étudiants dans une matière donnée.
1.1 Notion de population et d’échantillon
L’analyse statistique repose sur deux concepts fondamentaux :
- La population : Il s’agit de l’ensemble des individus ou objets sur lesquels on souhaite recueillir des informations.
Exemple : Tous les habitants d’un pays. - L’échantillon : Il correspond à un sous-ensemble de la population, sélectionné pour représenter cette dernière.
Exemple : Un groupe de 1 000 personnes tirées au hasard dans une ville.
L’analyse d’un échantillon est souvent plus pratique que celle de l’ensemble de la population, car elle est moins coûteuse et plus rapide. L’échantillon doit être représentatif pour éviter les biais d’analyse.
Différence entre population et échantillon :
Concept | Définition | Exemple |
---|---|---|
Population | Ensemble complet d’individus étudiés | Tous les étudiants d’une université |
Échantillon | Sous-ensemble sélectionné pour représenter la population | 200 étudiants choisis aléatoirement |
1.2 Types de variables et échelles de mesure
En statistique, une variable est une caractéristique mesurable d’un individu ou d’un objet étudié. On distingue plusieurs types de variables.
1.2.1 Variables qualitatives (catégoriques)
Les variables qualitatives prennent des valeurs qui représentent des catégories ou des classes.
- Variables nominales : Elles n’ont pas d’ordre entre les catégories.
Exemples : couleur des yeux (bleu, vert, marron), nationalité (français, italien, espagnol). - Variables ordinales : Elles possèdent un ordre naturel, mais l’écart entre les catégories n’est pas mesurable.
Exemples : niveau d’étude (primaire, secondaire, universitaire), satisfaction client (faible, moyen, élevé).
1.2.2 Variables quantitatives
Les variables quantitatives prennent des valeurs numériques et permettent d’effectuer des calculs arithmétiques.
- Variables discrètes : Elles prennent des valeurs entières et dénombrables.
Exemples : nombre d’enfants dans une famille (0, 1, 2, …), nombre de voitures vendues par un concessionnaire. - Variables continues : Elles peuvent prendre une infinité de valeurs dans un intervalle donné.
Exemples : taille d’une personne (170,5 cm), revenu mensuel (2 345,78 €), température.
1.2.3 Échelles de mesure
L’échelle de mesure d’une variable détermine les méthodes d’analyse et les opérations mathématiques qui peuvent être effectuées.
Échelle | Définition | Exemples | Opérations possibles |
---|---|---|---|
Nominale | Catégories sans ordre | Sexe (H/F), Type de produit | Comptage, mode |
Ordinale | Catégories avec ordre | Niveau de satisfaction (faible, moyen, élevé) | Comparaison (>, <) |
Intervalle | Différences mesurables, pas de zéro absolu | Température en °C | Addition, soustraction |
Ratio | Différences mesurables, zéro absolu | Revenu, poids, taille | Multiplication, division |
Attention ! L’échelle de mesure détermine le type d’analyse possible. Par exemple, on ne peut pas calculer une moyenne pour une variable ordinale, mais on peut déterminer un classement.
1.3 Exemples pratiques
Example 1.1 Analyse des clients d’un magasin
Variable | Type | Échelle |
---|---|---|
Âge | Quantitative continue | Ratio |
Catégorie socio-professionnelle | Qualitative | Nominale |
Nombre d’achats mensuels | Quantitative discrète | Ratio |
Niveau de satisfaction (faible, moyen, élevé) | Qualitative | Ordinale |
Example 1.2 Étude des performances sportives
Variable | Type | Échelle |
---|---|---|
Temps de course (en secondes) | Quantitative continue | Ratio |
Catégorie de compétition (junior, senior) | Qualitative | Ordinale |
Nombre de médailles obtenues | Quantitative discrète | Ratio |
Genre (homme, femme) | Qualitative | Nominale |
1.4 Conclusion
Dans ce chapitre, nous avons défini les concepts fondamentaux de la statistique descriptive :
- Différence entre statistique descriptive et inférentielle
- Concepts de population et d’échantillon
- Types de variables et leur classification
- Importance des échelles de mesure dans l’analyse des données
Ces notions sont essentielles pour bien comprendre et interpréter les résultats statistiques. Nous allons maintenant explorer les statistiques descriptives univariées, qui permettent de résumer une seule variable à l’aide de mesures de tendance centrale et de dispersion.
1.5 Exercices
Exercise 1.1 (QCM) Voici une série de questions à choix multiples (QCM) pour consolider les notions abordées dans le premier chapitre de votre livre sur l’introduction à la statistique descriptive :
- Qu’est-ce qu’une donnée nominale ?
- Quelle est la principale caractéristique d’une variable ordinale ?
- Quelle échelle de mesure permet d’effectuer des opérations de multiplication et division ?
- Quel est un exemple de variable quantitative discrète ?
- Quelle caractéristique distingue une variable continue d’une variable discrète ?
- Quelle est la meilleure représentation graphique pour une variable nominale ?
- Parmi les variables suivantes, laquelle correspond à une échelle d’intervalle ?
- Pourquoi une échelle de ratio est-elle plus informative qu’une échelle d’intervalle ?
- Quelle méthode permet de s’assurer que l’échantillon est représentatif de la population ?
- Quel est l’intérêt d’identifier le type de variable avant d’analyser les données ?
- Quel type de variable permet uniquement des opérations de comptage et de mode ?
- Quelle variable est toujours considérée comme continue ?
- Quelle propriété caractérise une variable d’échelle nominale ?
- Quelle est une méthode courante pour sélectionner un échantillon représentatif ?
- Parmi les variables suivantes, laquelle est de type quantitative discrète ?
- Pourquoi est-il important de connaître l’échelle de mesure d’une variable ?
- Quelle variable suit une échelle de ratio ?
- Quel est un inconvénient majeur de l’échantillonnage non aléatoire ?
- Une variable “couleur des yeux” appartient à quelle catégorie ?
- Quelle est une différence entre une échelle d’intervalle et une échelle de ratio ?
Exercise 1.2 Un institut de sondage réalise une étude sur les habitudes alimentaires des habitants d’une ville. L’étude porte sur un échantillon de 500 personnes sélectionnées au hasard parmi la population de 50 000 habitants.
Les enquêteurs recueillent les informations suivantes pour chaque individu :
- Âge (en années)
- Sexe (Homme / Femme)
- Nombre de repas pris au restaurant par mois
- Type de régime alimentaire suivi (Omnivore, Végétarien, Végétalien, Autre)
- Dépenses mensuelles en alimentation (en euros)
Questions :
- Identifiez la population et l’échantillon dans cette étude.
- Définissez un individu dans le cadre de cette enquête.
- Classez chaque variable selon son type (qualitative / quantitative) et précisez son échelle de mesure (nominale, ordinale, intervalle ou ratio).
- Parmi les variables étudiées, lesquelles sont discrètes et lesquelles sont continues ?
- Justifiez pourquoi le type de régime alimentaire suivi est une variable qualitative nominale et non ordinale.