UE Lexiques : élaboration et exploitation (PERL)

Diplômes intégrant cet élément pédagogique :

Descriptif

Ce cours a pour objectif de présenter la modélisation des unités lexicales et l’acquisition de propriétés lexicales à partir de corpus. Il introduit les différents types d’unités lexicales, leurs propriétés syntaxiques et sémantiques pour des applications de TAL. Dans un second temps, des techniques statistiques d’exploitation de corpus sont présentées : éléments de statistique lexicale et modèles probabilistes pour le TAL (introduction modèles de langage) ; modèles vectoriels et textométrie ; mesures de spécificité et mesures d’association ; extraction d’expressions polylexicales (segments répétés, arbres récurrents, motifs...).

Bibliographie

-          Baroni, Marco and Evert, Stefan (2008). Statistical methods for corpus exploitation. In A. Lüdeling and M. Kytö (eds.), Corpus Linguistics. An International Handbook, article 36. Mouton de Gruyter, Berlin. [manuscript: http://purl.org/stefan.evert/PUB/BaroniEvertHSK38_manuscript.pdf]

-          Gala, Nuria.et Zock, Mickael. éds. (2013) Ressources lexicales : contenu, construction, utilisation, évaluation. Lingvisticæ Investigationes Supplementa 30, John Benjamins Publishing, Amsterdam.

-          Lebart, L. & Salem, A. (1994). Statistique Textuelle (http://lexicometrica.univ-paris3.fr/livre/st94/st94-tdm.html)

-          Lehmann, A., Martin-Berthet, F. (2013). Introduction à la lexicologie. Paris : Armand Colin.

Modalités de contrôle des connaissances

Session 1 ou session unique - Contrôle de connaissances

NatureTypeNature d'évaluationDurée (min)Coeff.
ECCC Ecrit et TP03/100

Session 2 - Contrôle de connaissances

NatureTypeNature d'évaluationDurée (min)Coeff.
ECCC Oral03/100

Informations complémentaires

Méthode d'enseignement : En présence
Lieu(x) : Grenoble - Domaine universitaire
Langue(s) : Francais