Diplômes intégrant cet élément pédagogique :
Descriptif
Dans ce module, nous allons voir comment construire des représentations de contenus multimédia (texte, audio, images et vidéos) et comment utiliser ces représentations pour faire une indexation automatique et une recherche par le contenu dans des collections de documents multimédia. Nous aborderons les méthodes dites classiques mais nous verrons principalement les méthodes basées sur l’apprentissage profond (deep learning).
Les 15h de TP seront utilisés pour réaliser et optimiser un système complet d’indexation automatique par apprentissage profond de concepts visuels dans une collection d’images. Nous verrons l’environnement d’apprentissage profond "pytorch". Nous travaillerons sur GPU sur la plateforme Grid’5000 dans le cadre d’un "teaching lab".
Le site du cours est http://gbgi9u07.imag.fr
Pré-requis recommandés
Connaissances générales en algèbre linéaire et en calcul différentiel (un rappel sera fait).
Programmation python, numpy, scypy, matplotlib (un TP de révision / introduction est prévu).
Compétences visées
Être capable de mettre en œuvre des systèmes basés sur l’apprentissage profond pour l’indexation et la recherche par le contenu dans des collections de documents multimédia.
Informations complémentaires
Lieu(x) : GrenobleLangue(s) : Français
En bref
Période : Semestre 9Crédits : 3
Volume horaire
- CM : 15h
- TD : 15h
Contact(s)
Quénot Georges

Etudiants internationaux
Crédits : 3.0