UE Big data

Diplômes intégrant cet élément pédagogique :

Descriptif

- Comprendre les limites du SGBDR traditionnel face aux nouveaux usages
- Maîtriser les technologies de pointe dans le domaine de l’accès aux donnés distribuées et à la parallélisassions des traitements
- Acquérir un niveau d’expertise  dans le déploiement de nouvelles architectures de gestion et de traitement de l’information

Programme résumé
Caractéristiques des nouveaux usages
- Patterns d’accès: débit, distribution (Zipf…), caches
- Introduction aux BD réparties: sharding, DHT (P2P)
- Modèles de cohérence
- Tolérance aux pannes
Nouveaux modèles de données
- SGBD distribués (Oracle 11g)
- NoSQL: Dynamo (Amazon), Cassandra (Facebook), CouchDB …
- Bases de données pour graphs: FlockDB (Twitter), Neo4j
Calcul large échelle
- Map-Reduce (Google): Apache HDFS, Hadoop, Pig
- Traitement par flux: Storm (Twitter), S4

Logiciels utilisés : Hadoop Map-Reduce, ORACLE, Storm ...

Pré-requis

Base de données et SGBD relationnels

Informations complémentaires

Méthode d'enseignement : En présence
Lieu(x) : Grenoble - Domaine universitaire
Langue(s) : Français