Généalogie des éléments de langage

Généalogie des éléments de langage

Porteur : Polyfact (Jules Potel)
1 personne inscrite
Députés et sénateurs Exploitation des compte-rendus
Galerie des fêtes de l'Hôtel de Lassay

Numéro de table à l'Hôtel de Lassay

T9

Ce contenu est contributif, il n'est pas rédigé par l'Assemblée nationale.

Le contenu de cette page est écrit par les contributeurs du projet depuis le dépôt de code.

À propos du défi

Choisir un ou plusieurs éléments de langage et observer leur propagation au sein d'un groupe, puis des autres groupes à travers le temps.

Qui invente les mots de la politique, qui les reprend, et que deviennent-ils ? À partir de l'API de transcription que Polyfact a construite à partir des données publiques de l'Assemblée nationale (vidéos des débats) et mise à disposition pour le hackathon, nous avons parcouru l'intégralité des débats transcrits — 8 957 séances (séances publiques, commissions, questions au gouvernement), soit 114 millions de mots horodatés et attribués à leur orateur, de juin 2017 à juillet 2026 — pour retracer le cycle de vie complet de 25 formules politiques : leur naissance publique, leur entrée à l'Assemblée, leur diffusion de groupe en groupe et leur mort — ou leur fossilisation.

Méthode. Recherche littérale de chaque formule (variantes orthographiques et flexions, exclusions de contextes hors-sujet), avec audit des faux positifs sur échantillons, formule par formule ; rattachement de chaque orateur à son groupe politique à la date de la séance via les mandats officiels (données ouvertes AMO), ce qui suit correctement les élus qui changent de groupe ; usages exprimés en occurrences par million de mots prononcés (le volume transcrit triple entre 2018 et 2025, les comptes bruts sont trompeurs) ; chaque affirmation contre-vérifiée dans les données (dates, attributions, comptages).

Résultats marquants (sujet présenté : le lexique du Covid et de l'État protecteur) :

  • Les mots du Président entrent à l'Assemblée par la bouche de ses adversaires. « Quoi qu'il en coûte » (allocution du 12 mars 2020) est repris sept jours plus tard, le même jour, par Éric Woerth (LR), Valérie Rabault (PS) et Fabien Roussel (PCF) — avant la majorité — comme une reconnaissance de dette.
  • 79 % des usages de « quoi qu'il en coûte » sont posthumes, postérieurs à son acte de décès officiel (« le quoi qu'il en coûte, c'est fini », Bruno Le Maire, 30 août 2021). Son pic absolu tombe en octobre 2024, 1 128 jours après. Une formule ne meurt pas : elle se fossilise en catégorie budgétaire.
  • Les généalogies s'inversent. « Les jours heureux » circulait chez Mathilde Panot (LFI) 118 jours avant l'allocution présidentielle ; « premiers de corvée », forgée par Jean-Luc Mélenchon, dort 919 jours puis entre à l'Assemblée… par un député de la majorité, avant qu'un socialiste ne l'attribue à Emmanuel Macron lui-même. Le stade final d'un élément de langage, c'est l'anonymat.

L'étude complète — interactive, bilingue, avec deux autres sujets (le lexique sécuritaire et identitaire venu des marges ; la capture de la « planification écologique ») — est publiée sur polyfact.com/recherche. Ce dépôt contient le code d'exploitation de l'API, les agrégats, les diapositives de présentation et le rapport PDF.

Galerie d'images

Aucune image détectée.

Documents du défi

Informations du défi

Livrables du défi

Ressources utilisées

Participants

Porteur du défi

Polyfact (Jules Potel)

Contributeurs

Jules Potel