Ce jeudi 22 janvier, l'équipe "Syntaxe, Sens, Textualité"' du laboratoire ICAR ouvre son année 2026 avec un premier séminaire accueillant deux intervenant.es : Damon Mayaffre, qui évoquera ses recherches sur les modèles de langage entrainés au discours politique, et Leela Azorin, qui parlera de ses recherches sur les contractions du semi-modal émergent "be going to/gonna". Ce séminaire est à destination de tous les professeur.es et étudiant.es en Sciences du Langage.
Introduction
2026 commence pour l'équipe "Syntaxe, Sens, Textualité" du laboratoire ICAR, avec son premier séminaire de l'année.
Il se tiendra à l'ENS de Lyon, ce jeudi 22 janvier. Tous.tes professeur.es et étudiant.es en Sciences du Langage est aimablement convié.e à y assister en présentiel ou en distanciel (via ce lien : https://visio.univ-lyon2.fr/den-b83-rka-lik)
Programme
Au programme, deux intervenant.es, Damon MAYAFFRE (BCL - CNRS – Université Côte d’Azur) ainsi que Leela AZORIN (ENS Lyon / ICAR), viendront exposer certains de leurs travaux récents.
- 14h30-15h30 : Damon MAYAFFRE
-
Titre de l'intervention :
Cooccurrences, bigrams ou segments répétés ? Ce que génère un Transformer entraîné au discours politique
Description :
La détection d’isotopies dans les discours (ici le discours politique) est une préoccupation méthodologique centrale de l’ADT, dans la mesure où il s’agit de transformer des corrélations statistiques calculées en corpus en corrélats sémantiques interprétés en discours.
Au fond, passer des chiffres au sens, et du quantitatif au qualitatif.
Cette intervention propose une analyse synchronique des grandes isotopies structurant le discours présidentiel d’Emmanuel Macron depuis son accession au pouvoir (148 discours, 501.817 occurrences), afin d’identifier les thématiques dominantes, voire l’idéologie du président.
Le corpus est non-contrastif (uniquement Macron ; il ne s’agit pas de calculer ses spécificités lexicales par rapport à d’autres) et filtré morpho-syntaxiquement sur les seuls substantifs (réputés plus immédiatement porteurs de sens).
L’étude mobilise deux approches complémentaires. D’une part, l’analyse des profils cooccurrenciels des mots, issue de l’ADT classique (Viprey, 1997, 2006), reposant sur un traitement benzecrien (analyses factorielles des correspondances sur matrices triangulaires), permet d’identifier quatre isotopies majeures : régalienne (« France », « frontière » etc.), sociale (« santé », « retraite », etc.), économique (« budget », « dette », etc.) et sociétale (« violence » faite aux « femmes », etc.). D’autre part, l’analyse des profils attentionnels des mots, fondée sur des modèles neuronaux récents (Vanni et al., 2026) et conduite selon une démarche exploratoire comparable, confirme ces résultats tout en faisant émerger une cinquième isotopie encore à caractériser.
La discussion interroge la plus-value des modèles transformer dans l’outillage traditionnel de l’ADT. Si la centralité de la micro-distribution des mots dans la construction du sens en corpus est bien établie, la capacité des mécanismes attentionnels (self-attention) à dépasser — ou à reproduire — les calculs classiques de cooccurrence, de bi-grams ou de segments répétés doit nous interroger.
Références :
Benzécri J.-P. (1973), L'Analyse des données. Tome 2 : L'Analyse des correspondances, Dunod, 1973.
Lebart L , Pincemin B. , Poudat C. (2019), Analyse des données textuelles. Québec : Presses de l'Université.
Rastier F. (2011), La mesure et le grain. Sémantique de corpus. Paris : Champion
Vanni L. et Mayaffre D. (2026), « Une autre Intelligence Artificielle est-elle possible? », dans Cahiers de sémiotique des cultures, n° 5, 2026 – 1.
Vaswani, A. et al. (2017) « Attention is all you need », in Proceedings of the 31st International Conference on Neural Information Processing Systems. Red Hook, NY, USA: Curran Associates Inc. (NIPS’17), p. 6000‑6010.
Viprey J.-M. (1997). Dynamique du vocabulaire des Fleurs du mal. Paris : Champion.
Viprey J.-M. (2006). « Structure non-séquentielle des textes », Langages, 163, pp. 71-85. - 15h30-16h30 : Leela AZORIN
-
Titre de l'intervention :
Catégorisation syntaxique et sémantique de la variation : étude linguistique et phonétique des contractions du semi-modal émergent BE going to/gonna
Description :
Cette présentation examine la variation et la catégorisation des formes du paradigme BE going to/gonna dans deux corpus représentatifs de l’innovation linguistique : un corpus écrit du web (Climate Change Tweets) et un corpus d’anglais oral spontané (Santa Barbara Corpus of Spoken American English). Une typologie des formes observées (gonna, gunna, gon, i’ma, etc.) permet d’interroger leur statut au sein d’un même système et leurs emplois sémantico-pragmatiques. L’analyse croise des critères syntaxiques, morphosyntaxiques, phonétiques et sémantico-pragmatiques. L’étude vise à éclairer le statut syntaxique de ces formes grammaticalisées et à montrer comment elles expriment la prédiction, sens historiquement associé à BE going to, tout en explorant dans quelle mesure les variants plus réduits traduisent un déplacement de sens ou de fonction. Les résultats invitent alors à repenser les frontières entre les concepts de variation, réduction et changement linguistique
Informations pratiques
Lieu(x)
Hors les campus