Elections piège(s) à équation(s)

Tribune libre
Écrit par Avner Bar-Hen
Publié le 19 avril 2014

Si vous perdez ou gagnez un match de foot il est normal de quantifier le gain ou la perte. Pour les élections c’est un peu différent : le vainqueur chante à tue-tête, le perdant noie son chagrin et le commentateur politique y va de sa ritournelle. C’est donc tentant d’essayer de démêler l’histoire car si le vote est privé, les votes sont publics. Mais que veut dire public ?

La première idée est donc d’aller sur le site du Ministère de l’Intérieur. Le Ministère de l’Intérieur est chargé de l’organisation matérielle des élections politiques, mais également de la préparation et du suivi du droit électoral et là, bonne surprise : un site est dédié aux élections. Un jeu de menu cliquable ou déroulant permet d’avoir assez facilement accès au résultat du premier tour et aux élus mais cela donne rapidement envie de voir un peu plus les données. Et là, surprise : les données ne sont disponibles qu’au niveau de la ville (et non du bureau de vote) et il est impossible de télécharger l’ensemble du jeu de données. Données pas plus disponibles sur www.data.gouv.fr, la plate-forme d’open-data de l’état. Bel exemple de confusion entre données ouvertes et données accessibles. A quoi ça sert de mettre à disposition les données si on ne peut les utiliser pour l’usage de son choix ? On pourrait croire que c’est une erreur ou que l’information va bientôt arriver mais il est en fait beaucoup plus simple de commenter les résultats que de les obtenir. Par exemple il a fallu attendre une action de crowdsourcing et de l’association Regards citoyens pour commencer à avoir une géolocalisation des bureaux de vote. Heureusement que l’ANR a financé le joli projet Cartelect.

La partie la plus visible des maths dans les élections est sans aucun doute la partie sondage. Domaine abordé plusieurs fois sur Images des Maths mais se limiter aux sondages reviendrait à ne considérer le rôle des maths qu’avant les élections et ce serait aussi oublier qu’une ancienne dénomination de la statistique en anglais est « politique arithmétique ».

Une autre application est la détection de fraude et la littérature est nombreuse et récente sur le sujet (voir par exemple ici) et sur IdM (ici ou ). On peut aussi se demander comment se répartit le vote, par exemple le vote par procuration (voir par exemple ici ou ) ou si le taux d’abstention est relié à la taille de la ville (ici – même si on a envie de rappeler ce qu’est l’ecological fallacy bizarrement traduit par inférence écologique – ).

Il est classique qu’un parti au pouvoir perde les élections intermédiaires (et je ne crois pas que ce soit caractéristique de la France). Une défaite est donc une perte supérieure à la perte attendue pour un parti au pouvoir lors d’une élection considérée comme intermédiaire. Pour avoir un débat il serait donc bon de pouvoir quantifier cette perte. L’absence de quantification est la porte ouverte à toutes les affirmations démagogiques et donc à tous les bateleurs politiques de bas étage. Éviter de comparer avec le passé est probablement une certitude qu’on peut raconter n’importe quoi sans que cela laisse de trace mais conduit rapidement à l’absence d’analyse.

Une dernière question qui est souvent débattue au doigt mouillé (même si le présent billet ne revendique absolument pas l’exhaustivité sur le sujet) est la question des reports de voix. Autant il est possible de savoir les résultats des deux tours (sauf pour les dernières élections), autant on ne peut connaître la proportion de gens ayant voté pour le candidat A au 1er tour et pour le candidat B au deuxième tour. On pourrait rajouter les abstentionnistes et les votes nuls afin de quantifier une éventuelle mobilisation en faveur d’un parti ou d’un groupe politique. On peut donc représenter le vote par une table de contingence (qu’on peut aussi appeler un tableau croisé) dont les cases sont constituées des effectifs (ou de la proportion) d’électeurs ayant le comportement électoral A au premier tour et le comportement électoral B au deuxième tour. Les résultats de chacun des tours sont connus (ce qui correspond aux marges de la table) alors que les cases de la table sont inconnues. Voici un joli problème de maths (voir par exemple ici pour un travail récent) qui pourrait parfois éviter de dire n’importe quoi (voir par exemple l’analyse de Joël Gombin).

On pourrait penser que dans une démocratie installée, l’accès à l’information du vote est fondamental pour un débat politique sincère (pour reprendre le titre de la proposition de loi sur la présentation des sondages politiques (voir ici le dossier du sénat), dont le cheminement est digne d’un roman policier). L’absence de quantification et de modélisation est un frein au débat politique. En bloquant nos salaires d’enseignant-chercheur, nous participons à la lutte contre le déficit (et à l’allègement des charges patronales), par nos travaux scientifiques nous pouvons peut-être lutter contre le déficit d’idées dont les répercussions sont au moins aussi dangereuses pour le citoyen.

ÉCRIT PAR

Avner Bar-Hen

Professeur titulaire de la chaire "statistiques et données massives". - Conservatoire National des Arts et Métiers (CNAM)

Partager