UE Analyse des données, web des données et web sémantique

Diplômes intégrant cet élément pédagogique :

Descriptif

L’objectif de ce cours est de présenter le cadre général du Web Sémantique (ou Web des Données) qui permet l'échange, le partage et la réutilisation de données entre applications au travers des entreprises et des communautés d'utilisateurs. C'est le fruit d'un effort collaboratif mené par le World Wide Web Consortium (W3C) avec la participation de nombreux partenaires issus du monde de la recherche et de l'industrie.

Le Web Sémantique vise à intégrer et publier et à partager des données structurées en les reliant entre elles (Linked-Data) en s'appuyant sur l'infrastructure du Web. Dans ce cadre, les ontologies , en structurant de manière formelle la connaissance jouent un rôle essentiel : elle permettent de donner une sémantique précise aux données. Basées sur le même modèle de distribution que pour les données, elles encouragent le partage et la réutilisation des connaissances, facilitent l'interprétation des données par des programmes qui peuvent éventuellement les enrichir en s'appuyant sur des mécanismes d'inférences bien définis.

Ce cours se focalise sur certaines des technologies standardisées par le W3C et qui sont au cœur du web sémantique:

- RDF (Resources Description Famework) qui propose un modèle de représentation des données accessibles via des IRIs (Internatianlized Resource Identifiers) et qui permet de représenter des graphes de connaissances distribués sur le web (Linked Data)

- RDFa, JSON-LD, Schema.org qui permettent d'inclure des données structurées dans des pages webs.

- Les triplestore (bases de données orientées RDF) et SPARQL qui permettent le stockage et l'interrogation des données du Web Sémantique

- RDFS, OWL et SKOS qui, en dessus de RDF, offrent l'expressivité nécessaire à la modélisation de vocabulaires contrôlés et d'ontologies et qui donnent une sémantique formelle aux données, permettant ainsi de définir un modèle pour celle-ci à partir duquel des inférences (déductions logiques) peuvent être réalisées pour déduire de nouvelles informations.

La présentation en cours de ces différents langages et technologies s'appuie sur des exemples concrets de mise en œuvre ( DBpedia, WikiData, Europeana , BNF...). Elle est complétée par des exercices pratiques sur machine (avec le framework , Java Apache Jena, les triples stores Jena TDB - Fuseki et GraphDB , et l'éditeur d'ontologies Protégé-OWL) et la réalisation d'un mini projet, permettant aux étudiants de se confronter directement et concrètement à la mise œuvre d'applications s'appuyant sur le web sémantique.

Site web de l'UE

Informations complémentaires

Site web de l'UE

Langue(s) : Français