Diplômes intégrant cet élément pédagogique :
Descriptif
Ce cours est une introduction au traitement automatique des langues naturelles (TALN). On aborde successivement – les notions de linguistiques essentielles pour un informaticien, – un panorama des outils du TALN et de méthodes de développement d'outils, – les modèles de langues et leur construction (avec du TD), – l'analyse syntaxique à partir d'une grammaire (avec du TD et la mise en pratique d’algorithmes), – la traduction automatique (TA) et son évaluation dans une perspective historique et technique. Sur la TA les étudiants réalisent un TP individuel (rédaction d'un rapport d’expérience) noté dans lequel ils sont mis dans la situation d'un traducteur professionnel qui utilise ou non des outils du TALN pour l'aider dans son travail. En ce qui concerne la TA, on regarde en particulier la TA fondée sur le dialogue et la traduction de parole, on présente les approches statistiques et par réseaux de neurones profonds. On insiste sur l'évaluation automatique et le recul nécessaire à la lecture des résultats d'évaluation.
- acquérir les notions essentielles de linguistique
- connaître les différents types d'applications et les services qu'elles rendent
- acquérir les notions de base sur les modèles de langue
- acquérir les notions de base en analyse syntaxique, la hiérarchie de Chomsky et l'algorithme CYK
- acquérir les notions de base en Traduction Automatique et son évaluation
- comprendre pourquoi le Traitement Automatique des Langues Naturelles est difficile
Pré-requis recommandés
notions en probabilité et statistique
Compétences visées
avoir une vision des outils du Traitement Automatique des Langues Naturelles que l'on pourrait utiliser pour répondre à différents besoins
Bibliographie
Speech and Language Processing. Dan Jurafsky and James H. Martin (https://web.stanford.edu/~jurafsky/slp3/)
Informations complémentaires
Deux TD et un TP individuel nécessitant l'utilisation de système de Traduction Automatique
Langue(s) : Français