Niveau d'étude
Bac +5
ECTS
3 crédits
Crédits ECTS Echange
3.0
Composante
UFR IM2AG (informatique, mathématiques et mathématiques appliquées)
Période de l'année
Automne (sept. à dec./janv.)
Description
Ce cours fait suite aux cours de M1 et en particulier au UE d’Analyse de données et modèles de régression linéaires et modèles GLM. Dans ce cours on s’intéresse à l’analyse de données dites complexes et particulièrement présentant un problème de grande dimensionnalité. On va s’intéresser particulièrement à la détection du fléau de dimension et y porter des solutions. En voici les grandes lignes : reconnaissance et détection du problème de la dimension, Tests statistiques multiples en grandes dimension (procédures contrôlant le FWER, le FDR); sélection de modèles en grande dimension (par pénalisation type ridge, lasso). Les aspects pratiques seront mis en avant dans ce cours
Heures d'enseignement
- CMCM12h
- TPTD12h
Pré-requis recommandés
Maîtrise des cours d’analyse de données, de régression et inférence statistique de niveau M1 SSD. Bonne maîtrise du logiciel R.
Période
Semestre 9
Compétences visées
À l’issue de cette UE, l’étudiant devrait être capable de détecter les problèmes de dimension (s’il en existe), d’y remédier en choisissant les méthodes adéquates et de les implémenter en utilisant un langage tel que R.
Bibliographie
- T. Hastie, R. Tibshirani, and J. Friedman. The elements of statistical learning. Springer Series in Statistics. Springer-Verlag, New York, 2001. Data mining, inference, and prediction
- Giraud, C. Introduction to high-dimensional statistics. Monographs on Statistics and Applied Probability, 139, 139, 2015.