Niveau d'étude
Bac +4
ECTS
3 crédits
Composante
UFR Langage, lettres et arts du spectacle, information et communication
Description
Ce cours s’adresse à des étudiants qui souhaitent s’initier et réfléchir au traitement statistique des données et à leur recueil. Il est destiné à un public souvent peu familiarisé avec les mathématiques et ne requiert aucune connaissance préalable. Il est conçu pour présenter les statistiques de façon attrayante, claire.
Dans une première partie, des notions de base de statistique seront présentées puis approfondies à partir d’exemples concrets, qui mobiliseront votre compréhension des procédures plutôt que leur formulation mathématique. Une partie de cette section sera consacrée à définir ce qu’on appelle le Big Data. En plus des aspects techniques, l’objectif est vous permettre d’acquérir quelques outils critiques pour réfléchir à l’utilisation sociale et politique des statistiques.
Dans une seconde partie, il s’agira de vous rendre plus autonomes pour mettre en œuvre les notions de statistique sur des logiciels qui seront mis à votre disposition. À partir de vraies données langagières (par exemple, concernant l’utilisation du langage sur Twitter), nous aborderons les notions suivantes : tendance centrale (moyenne), dispersion (écart-type), forme des distributions (distribution normale), significativité, comparaison de moyennes, corrélation, analyse de tableaux, analyse impliquant plusieurs variables. Le but est de vous rendre autonomes dans la capacité à traiter des données quantitatives lors de travaux de recherche, de rapports de stage, etc.
Objectifs
Objectifs
- Apprendre à réfléchir à des résultats statistiques (sondages, enquêtes épidémiologiques, etc.)
- Comprendre la logique des notions de base en statistique descriptive et inférentielle
- Utiliser un logiciel de statistique pour mettre en œuvre ces notions sur un jeu de données
- Maitriser les logiques de base nécessaires pour planifier une analyse statistique
Heures d'enseignement
- Recueil et traitement quantitatif des données linguistiques - CMCM4h
- Recueil et traitement quantitatif des données linguistiques - TDTD12h
Contrôle des connaissances
Dossier : choix entre trois modalités
- traiter un jeu de données et rendre un compte rendu écrit
- faire l’analyse critique des méthodes et des interprétations d’un article contenant des statistiques sur le langage
- Pour les étudiants les plus avancés : écrire sous R et mettre en en application les procédures vues en cours
Période
Semestre 7
Compétences visées
- Recueillir, analyser et décrire des données en utilisant des méthodes relevant de différents domaines des Sciences du Langage
- Mettre en œuvre ses compétences techniques, critiques et réflexives pour mener des enquêtes de terrain, mettre en œuvre une méthodologie de l’observation/de l’expérimentation, constituer et analyser un corpus, constituer des bases de données et mener une analyse statistique, en utilisant du matériel et des logiciels d’analyse de données.
Bibliographie
Dancey, Christine, et John Reidy. 2016. Statistiques sans maths pour psychologues: SPSS pour Windows - QCM et exercices corrigés. De Boeck Superieur.