Formation en Data Science

Introduction Générale

Wilson Toussile

ESSFAR ODC

1 Bienvenue !

  • Le monde actuel génère une quantité massive de données. La capacité à exploiter ces données est devenue une compétence clé pour prendre des décisions stratégiques éclairées dans tous les secteurs.

  • Cette formation s’adresse à vous, professionnels et étudiants, qui possédez déjà des bases en programmation et en statistiques et souhaitez devenir des data scientists compétents.

2 Objectifs Généraux

Notre but est de vous amener à :

  • Comprendre les enjeux et les applications de la data science dans divers secteurs (finance, santé, etc.).
  • Acquérir les compétences techniques pour manipuler, analyser et modéliser efficacement les données.
  • Développer une méthodologie de projet rigoureuse, de la collecte des données jusqu’au déploiement des modèles.

3 Objectifs Spécifiques

À la fin de cette formation, vous serez capable de :

  • Maîtriser les outils avancés de manipulation et d’exploration de données.
  • Appliquer les principales techniques de modélisation supervisée et non supervisée.
  • Réaliser des visualisations de données complexes pour une interprétation fine.
  • Conduire un projet complet en data science.
  • Découvrir les bases du déploiement de modèles de machine learning.

4 Le Plan de la Formation : 5 Jours Intensifs

Jour Thème principal
Jour 1 Introduction et Rappels (Python, Pandas, Visualisation, Quarto).
Jour 2 Analyse Exploratoire des Données (EDA) et Tests Statistiques.
Jour 3 Apprentissage Supervisé (Régression, Classification, etc.).
Jour 4 Apprentissage Non Supervisé (Clustering, Réduction de dimension).
Jour 5 Projet Pratique de A à Z et Introduction au Déploiement.

5 Une Approche Axée sur la Pratique

Notre pédagogie est résolument pratique pour garantir votre montée en compétences.

  • Plus de 60% du temps sera consacré à des ateliers pratiques et des mises en situation.
  • Les ateliers utiliseront des jeux de données réels issus de secteurs variés (e-commerce, finance, etc.).
  • Vous réaliserez un projet final complet, de la préparation des données au déploiement d’un modèle simple.

6 Les Outils de notre Formation

Vous travaillerez avec les outils standards de l’industrie de la Data Science.

Langage & Environnement

  • Python / R
  • Jupyter Notebook / Google Colab / RStudio / Positron

Manipulation de données

  • Numpy, Pandas
  • Tidyr, dplyr

Machine Learning

  • Scikit-learn

Visualisation & Reporting

  • Matplotlib, Seaborn, Plotly, ggplot2
  • Quarto, Shiny

Déploiement - Streamlit / Flask

7 Suivi et Modalités d’Évaluation

  • Plateforme Pédagogique : Tous les supports (notebooks, données, vidéos) seront accessibles sur Google Classroom. L’accès est garanti pour au moins trois mois après la formation.

  • Évaluation : Votre progression sera mesurée de manière continue.

    • Évaluations continues (Quizz) : 30%
    • Travaux pratiques et études de cas : 40%
    • Projet final : 30%

8 Prêts à commencer ?