> Formations > Technologies numériques > Langages et développement > Python > Formation Machine learning, du POC à la production

Formation : Machine learning, du POC à la production

Python au service de la data science

Machine learning, du POC à la production

Python au service de la data science


New

Le cours vous enseigne l'utilisation de Python pour la Data Science : la préparation des données, l'entraînement et la mise à disposition du modèle et des résultats. Les participants apprennent à utiliser divers outils et bibliothèques Python pour effectuer des tâches courantes de data science et de machine learning.


INTER
INTRA
SUR MESURE

Cours pratique en présentiel ou à distance

Réf. PYD
  3j - 21h00
Prix : 1910 CHF H.T.




Le cours vous enseigne l'utilisation de Python pour la Data Science : la préparation des données, l'entraînement et la mise à disposition du modèle et des résultats. Les participants apprennent à utiliser divers outils et bibliothèques Python pour effectuer des tâches courantes de data science et de machine learning.


Objectifs pédagogiques
À l’issue de la formation, le participant sera en mesure de :
Mettre en place les différentes étapes de préprocessing avec Python
Savoir choisir le modèle approprié pour une problématique donnée
Appliquer et évaluer des modèles sur des données réelles
Mettre à disposition un modèle dans le cloud et permettre son interrogation par le biais du API

Public concerné
Toutes personnes intéressées par l'apprentissage de Python et son application à la data science et au machine learning.

Prérequis
Connaissance du langage Python. Connaissances théoriques sur le machine learning.
Vérifiez que vous avez les prérequis nécessaires pour profiter pleinement de cette formation en faisant  ce test.

Méthodes et moyens pédagogiques
Travaux pratiques
La formation met l’accent sur la mise en pratique, afin d’assurer l’autonomie des participants.
Méthodes pédagogiques
Conçue par des experts, suite à leur retours d'expérience, cette formation passe en revue, les différentes étapes d'un projet de Machine Learning de sa conception à sa mise en production.

Modalités d'évaluation
Le formateur évalue la progression pédagogique du participant tout au long de la formation au moyen de QCM, mises en situation, travaux pratiques…
Le participant complète également un test de positionnement en amont et en aval pour valider les compétences acquises.

Programme de la formation

1
Import des données et preprocessing

  • L'environnement de développement Python / Anaconda / Jupyter Notebook.
  • Pandas : l’analyse de données tabulaires (CSV, Excel...), statistiques, pivots, jointures, filtres.
  • Traitement des valeurs manquantes : imputation par la moyenne, médiane, interpolation, knn…
  • Traitement des Outliers : analyse graphique, méthode de l’IQR, Z-score.
  • Standardisation.
  • Normalisation : Skewness et Kurtosis.
  • Données non balancées : Undersampling, Oversampling, SMOTE.
Travaux pratiques
Manipulation de Python dans un notebook Jupyter. Exercice de mise en pratique avec pandas. Mise en place de l’ensemble des pré-traitements à l’aide des librairies python spécifiques.

2
Entraînement de modèles et évaluation

  • Modèles d’apprentissage supervisés et non-supervisés les plus courants.
  • Entraînement de modèles avec Scikit-learn.
  • Méthodes d’évaluations : savoir choisir les bonnes métriques pour chaque problématique.
Travaux pratiques
Entraînement de plusieurs modèles supervisés et non supervisés, comparaison des performances et choix du meilleur modèle.

3
Optimisation des modèles et log des performances

  • Présentation des librairies Optuna, Hyperopt.
  • Présentation de l’approche Grid Search pour identifier les meilleurs hyper paramètres d’un modèle.
  • Log des hyper paramètres et des performances dans Mlflow.
Travaux pratiques
Optimisation des modèles élaborés dans la partie précédente et log des métriques / hyperparamètres dans Mlflow.

4
Modèle et Data Drift

  • Intérêt de vérifier le modèle Drift et le Data Drift.
  • Présentation des librairies Evidently et Streamlit.
Travaux pratiques
Mise en place d’un Dashboard Evidently pour monitorer le Drift des données.

5
Industrialisation : déploiement dans le cloud

  • Présentation du service AWS EC2.
  • Présentation de Flask pour le pour la mise à disposition d’un modèle de machine learning par le biais d’une API.
  • Présentation de divers outils de connexion à l’environnement virtuel tels que Putty, Visual Studio Code…
  • Déploiement du code par le biais de GitHub.
Travaux pratiques
Déploiement d’un modèle sur un environnement cloud avec la librairie Flask.


Parcours certifiants associés
Pour aller plus loin et renforcer votre employabilité, découvrez les parcours certifiants qui contiennent cette formation :

Avis clients
4,2 / 5
Les avis clients sont issus des évaluations de fin de formation. La note est calculée à partir de l’ensemble des évaluations datant de moins de 12 mois. Seules celles avec un commentaire textuel sont affichées.
ISSAM C.
28/04/25
4 / 5

Le sujet de la formation est par nature très riche et vaste.Je pense que 3 jours sont trop court pour vraiment manipuler et s’approprier la méthode complète.Les exercices permettaient de visualiser des concepts à différentes étapes du processus, mais très complexe à s’approprier en changeant d’exemple.Merci à Elyas pour sa patience et sa pédagogie.
SAID A.
28/04/25
4 / 5

Il faudrait un jour de plus pour pouvoir correctement s’exercer. La théorie prend le dessus sur la pratique
JEAN-BAPTISTE V.
28/04/25
3 / 5

Il y a beaucoup de théorie et les concepts sont généraux.Je pense que travailler sur un cas pratique au fil de l’eau serait plus appréciable.La première partie concernant le pré-processing prend beaucoup de temps (comme dans la réalité). J’aurais pensé que les parties 2 à 5 serait plus développés, revoir la numérotation du programme ?



Dates et lieux

Dernières places
Date garantie en présentiel ou à distance
Session garantie
Du 21 au 23 juillet 2025
FR
Classe à distance
S’inscrire
Du 13 au 15 octobre 2025 *
FR
Classe à distance
S’inscrire