Niveau d'étude
Bac +4
ECTS
3 crédits
Crédits ECTS Echange
3.0
Composante
UFR IM2AG (informatique, mathématiques et mathématiques appliquées)
Période de l'année
Printemps (janv. à avril/mai)
Description
Le cours d'Apprentissage Statistique I s'inscrit dans la continuité du cours d’Analyse de Données, et vise à donner une introduction au domaine de l'apprentissage statistique.
Après une introduction générale au domaine de de l’apprentissage statistique, nous évoquerons différents concepts et méthodes clés de l’apprentissage non-supervisé et étudierons en détail les algorithmes du clustering hiérarchique, des nuées dynamiques (k-means) et de clustering par modèles de mélange de gaussiennes. Nous aborderons ensuite le cadre de l’apprentissage supervisé au travers de l’algorithme des k plus proches voisins, des modèles probabilistes de classification (LDA, QDA et régression logistique) et terminerons par une introduction aux modèles pénalisés.
Les séances pratiques seront réalisées sous R.
Heures d'enseignement
- CMCM12h
- TPTP12h
Pré-requis recommandés
UE Analyse des données 1.
Période
Semestre 8
Compétences visées
- Avoir une vision des concepts et méthodes clés du domaine
- Appréhender les bases théoriques sous-jacentes
- Savoir mettre en oeuvre ces méthodes en R
- Acquérir des réflexes dans l’analyse d’un jeu de données
- Etre sensibilisé à l’importance des sorties graphiques
Bibliographie
- Friedman, J., Hastie, T., & Tibshirani, R. (2001). The elements of statistical learning (Vol. 1, No. 10). New York: Springer series in statistics.
- James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An introduction to statistical learning (Vol. 112, p. 18). New York: springer.