ECTS
3 crédits
Composante
UFR Sciences de l'Homme et de la Société (SHS)
Description
Le cours d'Apprentissage Statistique I s'inscrit dans la continuité du cours d’Analyse de Données, et vise à donner une introduction au domaine de l'apprentissage statistique.
Après une introduction générale au domaine de de l’apprentissage statistique, nous évoquerons différents concepts et méthodes clés de l’apprentissage non-supervisé et étudierons en détail les algorithmes du clustering hiérarchique, des nuées dynamiques (k-means) et de clustering par modèles de mélange de gaussiennes. Nous aborderons ensuite le cadre de l’apprentissage supervisé au travers de l’algorithme des k plus proches voisins, des modèles probabilistes de classification (LDA, QDA et régression logistique) et terminerons par une introduction aux modèles pénalisés.
Les séances pratiques seront réalisées sous R.
Objectifs
-
Connaître différentes méthodes de classification non-supervisées et supervisées
-
Savoir mettre en œuvre ces méthodes de classification dans l'environnement R
Compétences visées
-
Avoir une vision des concepts et méthodes clés du domaine
-
Appréhender les bases théoriques sous-jacentes
-
Savoir mettre en œuvre ces méthodes en R
-
Acquérir des réflexes dans l’analyse d’un jeu de données
-
Etre sensibilisé à l’importance des sorties graphiques
Bibliographie
-
Friedman, J., Hastie, T., & Tibshirani, R. (2001). The elements of statistical learning (Vol. 1, No. 10). New York: Springer series in statistics.
-
James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An introduction to statistical learning (Vol. 112, p. 18). New York: springer.