• Votre sélection est vide.

    Enregistrez les diplômes, parcours ou enseignements de votre choix.

Base de données cliniques et Big Data / Clinical database and Big Data

  • Composante

    Polytech Grenoble - INP, UGA

Description

 Acquérir :
  - Culture générale des écosystèmes Big Data
  - Notions d'architecture et d'intégration
  - Méthode de conception d'un lac de données
  - Méthodes et outils pour la collecte, l'organisation et l'exploration interactive de données massives et/ou complexes
  - Savoir-faire l'implémentation d'une plate-forme d'exploration de données de santé centré sur une base graphe

PARTIE THÉORIQUE (8H)
Partie 1 : Introduction / Contexte
- Big Data : définitions
- Regroupement de données
- Approche de construction d'un lac de données : workflow associé
- Les démarches péri-informatiques (gouvernance, CNIL, ?)
- Les écosystèmes autour du Big Data
- Considérations techniques (montée en charge, haute disponibilité, redondance, ...)

Partie 2 : Mise en œuvre sur un Entrepôt de Données de Santé (EDS)
- Contexte CHU
- Approche projet
- Workflow de traitements : ETL, Traitement, Accès
- Un exemple d'architecture générale
- Quelques outils indispensables
- Exemple d'un projet de EDS au CHUGA

Partie 3 : Conception d'un lac de données
- Contexte, objectifs, moyens.
- Concepts des bases graphes
- Domaines courants d'application
- Interopérabilité, web sémantique
- Du modèle à  la base orientée graphe
- Modèle pivot du lac, évolutions

Partie 4 : Implémentation d'une plate-forme interactive d'exploration de données complexes et massives
- Focus ArangoDB, Elastic, ETL, IHM
- Élaboration de données métier

PARTIE PRATIQUE (14H)
Partie 5 : Exercice de modélisation (2H)

Partie 6 : Mini-projet (12H)
Déployer un workflow de traitement de données : ETL, BD Graphe, Visualisation

Bilan des connaissances acquises (2H)

 

Acquire:
- General Culture of Big Data Ecosystems
- Architecture and integration concepts
- Method of designing a data lake
- Methods and tools for collecting, organizing and interactive exploration of massive and / or complex data
- Know-how implementation of a health data mining platform centered on a graph database.

THEORICAL PART (8H)
Part 1: Introduction / Background
- Big Data: Definitions
- Grouping of data
- Approach to build a data lake: associated workflow
- Peri-computing approaches (governance, privacy, ...)
- The eco-systems around Big Data
- Technical considerations (scalability, high availability, redundancy, ...)

Part 2: Implementation of a Health Data Warehouse (DHS)
- University Hospital of Grenoble Context
- Project approach
- Treatment Workflow: ETL, Treatment, Access
- An example of a general architecture
- Some indispensable tools
- Health Data Warehouse project example at the University Hospital of Grenoble

Part 3: Designing a data lake
- Context, objectives, means.
- Concepts of graph oriented databases
- Common areas of application
- Interoperability, semantic web
- From the model to the graph oriented database
- Pivot model of the lake, evolutions

Part 4: Implementation of an interactive platform for complex and massive data mining
- Focus ArangoDB, Elastic, ETL, HMI
- Business Data Development

PRACTICAL PART (14H)
Part 5: Modeling Exercise (2H)

Part 6: Mini-Project (12H)
Deploy a data processing workflow: ETL, BD Graph, Visualization

Assessment of acquired knowledge (2H)

Lire plus

Heures d'enseignement

  • Base de données cliniques et Big Data / Clinical database and Big Data - TPTP12h
  • Base de données cliniques et Big Data / Clinical database and Big Data - TDTD4h
  • Base de données cliniques et Big Data / Clinical database and Big Data - CMCM8h

Pré-requis recommandés

Connaissances générales en modélisation de l'information,  bases de données et langage de développement.

 

General knowledge in information modeling, databases and development language.

Lire plus

Période

Semestre 9

Évaluation initiale / Session principale - Épreuves

LibelléNature de l'enseignementType d'évaluationNature de l'épreuveDurée (en minutes)Nombre d'épreuvesCoefficient de l'épreuveRemarques
50/100

Bibliographie

- Théorie des graphes, Stéphane Pelle ENSG
- http://cours-fad-public.ensg.eu/pluginfile.php/1525/mod_resource/content/1/Theorie_des_graphes.pdf
- François Bouillé. Le modèle HBDS. ENSG 2013
- http://cours-fad-public.ensg.eu/mod/imscp/view.php?id=254
- Qwant et le machine learning, JRES 2017 - Sylvain Peyronnet
- https://www.jres.org/fr/videotheque?mode=replay&id=189&resolution=360
- Ph. GENOUD, Web des données : Les Principes-Les Standards du W3C - Journée Interopérabilité et Innovation - IGN-BRGM-OGC -7 Octobre 2014 -Paris


Lire plus