UE Apprentissage statistique 2

Diplômes intégrant cet élément pédagogique :

Descriptif

Ce cours aborde les différents champs du Machine Learning au travers de la libraire Python Scikit-Learn pour être en mesure de mener en autonomie et d'interpréter une analyse de données prédictive, de sauvegarder un modèle et de le réutiliser (e.g. data apps)

Ce cours associe un enseignement théorique des notions et une partie pratique pour leur mise en œuvre immédiate sous forme de TP (notebook Python)

- Maîtriser les notions de classification/régression et d'analyse non-supervisé

- Maîtriser les notions de validation de modèle, de compromis biais/variance et de sur-ajustement.

- Comprendre les objectifs et les limites d'une analyse prédictive

- Aborder différents outils de visualisation de données

- Adapter les prétraitements suivant la nature des données

- Sauvegarder et réutiliser un modèle dans une application web (e.g. Streamlit)

Pré-requis recommandés

Expérience en langage python et dans les outils de notebook associés (i.e. Jupyter lab ou Jupyter)

Compétences visées

Savoir implémenter une chaîne de traitements pour une analyse prédictive (Scikit-Learn)

Savoir adapter les stratégies méthodologiques aux questions posées et au jeu de données

Être capable de réaliser une étude critique de ses analyses et des performances associées

Adapter les outils de visualisation à la nature des jeux de données.

Bibliographie

- An Introduction to Statistical Learning, 2nd Edition, Trevor Hastie, téléchargeable gratuitement -> https://hastie.su.domains/ISLR2/ISLRv2_website.pdf

- Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow, 3rd Edition, Aurélien Géron

Informations complémentaires

Module composée de 12h de TD et de 12h de CM, l'évaluation porte sur un examen théorique (1/3 points) et un examen pratique (2/3 points) sous la forme d'un TP individuel à rendre en fin de séance.

Langue(s) : Français