Niveau d'étude
Bac +5
ECTS
3 crédits
Composante
UFR IM2AG (informatique, mathématiques et mathématiques appliquées)
Période de l'année
Automne (sept. à dec./janv.)
Description
Partie Systèmes décisionnels
Les systèmes d'information décisionnels, partie intégrante de la Business Intelligence, sont des systèmes qui traitent les flux de données d'une entreprise pour permettre les décisions des responsables. Dans ce cours, nous discutons les éléments qui composent ce flux. Le cours présente d'abord l'architecture et la conception de ces systèmes et la manière dont ils peuvent être modélisés en fonction des besoins de l'entreprise. Ensuite, nous expliquons la manière d'intégrer des données provenant de sources hétérogènes : extract-transform-load. Enfin, le cours présente les techniques de visualisation des données et la manière de traiter les questions de confidentialité dans les organisations.
Partie données large échelle
La digitalisation croissante de tous les domaines d'activité génère énormément de données dont le stockage et le traitement posent des défis. Cet enseignement vise à étudier les modèles et les différents frameworks de traitement de larges données. En outre, l'étudiant apprendra à mettre en place à l'aide des conteneurs Docker ces frameworks basées sur des architectures distribuées.
Heures d'enseignement
- CMCM12h
- CMTDCours magistral - Travaux dirigés24h
Pré-requis recommandés
- Bases de données
- Programmation (en Java et en Python serait un plus)
- Base de systèmes distribués
- Construire des images docker à l'aide d'un dockerfile
Compétences visées
Partie Systèmes décisionnels
Modéliser les systèmes d'aide à la décision pour les besoins des entreprises
Traiter des données provenant de sources variées pour en faire des données utilisables par l'entreprise.
- Présenter et visualiser les données des entrepôts de données
- Respecter la confidentialité des données et le RGPD dans la gestion des données.
Partie données large échelle
- Expliquer le modèle de traitement Map-Reduce (Google) et son utilisation
- Expliquer l'architecture distribuée de type master/worker
- Mettre en place un système de fichier distribué (HDFS) à l’aide de Docker
- Déployer Hadoop et Spark dans un environnement distribué
- Traiter les données brutes à l’aide des API Hadoop et Spark
- Utiliser le langage Python dans un environnement Spark, le langage Java dans un environnement Hadoop