Graphiques frelatés

Le 17 mars 2012  - Ecrit par  Étienne Ghys Voir les commentaires (19)

Peut-on imaginer un graphique plus dénué d’intérêt que celui qu’on trouve ce 10 mars dans Libération ?

PNG - 78.2 ko
Cliquer pour agrandir

Observons que :

  • Le résultat d’un sondage devrait toujours être assorti d’une marge d’erreur. Pour un sondage portant sur un millier de personnes cette marge est de quelques pourcents. Alors, passer de 28% à 26 % ne signifie absolument rien, à part peut-être que ça ne bouge pas beaucoup. Si le seul message est que ça ne bouge pas beaucoup, on pourrait se passer d’un graphique.
  • Voyons la « coordonnée horizontale » : le graphiste semble ignorer que deux mois séparent la première date de la deuxième et que la troisième n’est séparée que d’un mois de la deuxième. Il est vrai que la campagne présidentielle s’accélère.
  • « La coordonnée verticale » ? Eh bien, elle « s’étale » entre 26% et 28%. Si les intentions de vote aux mêmes dates avaient été de 28%, 27,9% et 28%,
    le graphiste aurait étalé entre 27,9% et 28% et le graphique aurait été exactement le même ; ça descend et ça remonte, voilà tout.

Un autre exemple, plus malhonnête encore ? Voici un graphique présenté par François Lenglet lors de l’émission Des paroles et des actes sur France 2 le 12 janvier dernier. Il s’agit de montrer les dépenses publiques en pourcentage du PIB, aux États-Unis, en Allemagne, dans la zone euro et en France.

JPEG - 42.2 ko
Cliquer pour agrandir

Les rectangles roses représentent en principe les pourcentages de 41,9%, 45,5%, 48,8% et 56,2%. On comprend bien que les barres supérieures, qui contiennent les noms des pays et les drapeaux, ne correspondent pas à 100 %. La limite inférieure ne correspond pas non plus à 0% : à la louche le rectangle français est deux fois plus haut que le rectangle américain et pourtant 56,2% est loin d’être le double de 41,9%. Un graphique bien fait ne devrait-il pas faire comprendre visuellement un phénomène ? Ce graphique n’essaye-t-il pas sournoisement de nous faire croire que la France dépense deux fois plus que les États-Unis ? Lorsque nous observons ce graphique, notre œil ne se limite-t-il pas à jauger des tailles relatives des rectangles ?
Il ne faut pas oublier que le téléspectateur n’a que quelques secondes pour interpréter ce graphique, tout en écoutant la présentation orale par François Lenglet qui en propose une interprétation.

Où faut-il placer le 0% pour que le graphique ait un sens ? Un instant de réflexion montre que c’est impossible. Entre 41,9% et 48,8%, il y a 6,9% ce qui est inférieur à la différence entre 48,8% et 56,2% qui est de 7,4%. Et pourtant, on voit bien que la différence des hauteurs entre la France et la zone euro est bien inférieure à celle des hauteurs entre la zone euro et les Etats-Unis...

Un graphique bidon, tout simplement ! Devant 3 millions de téléspectateurs :(

Exercice

J’ai mesuré les hauteurs de rectangles sur mon écran : 3,5 cm, 4,8 cm, 6,2 cm et 7,2 cm, correspondant donc à des pourcentages de 41,9%, 45,5%, 48,8% et 56,2%.
Calculez la hauteur $x$ à laquelle il faudrait placer le 0% sous la barre horizontale pour que le graphique soit cohérent. Montrez qu’il faudrait que
\[ \frac{3,5+x}{41,9} = \frac{4,8+x}{45,5} = \frac{6,2+x}{48,8} = \frac{7,2+x}{56,2} \]
et montrez que ces équations n’ont pas de solution, même approchée. Disons que mes mesures des longueurs soient précises à 1mm près. Cela suffit-il pour qu’on puisse quand même justifier le graphique ?

À vrai dire, il semble que les trois premières équations sont à peu près compatibles pour une valeur de $x$ de l’ordre de 13. Autrement dit, si l’on place la barre 0% à 13 cm sous le graphique, les trois premiers rectangles sont corrects, mais pas le quatrième : le rectangle français ! Si on convient que la ligne 0% est en effet à 13 cm sous le graphique, il faut rehausser le rectangle français de 2cm pour corriger l’ensemble : au lieu de 7,2 cm, il faudrait qu’il fasse 9,2cm.

Le « vrai » graphique devrait être :

JPEG - 318.4 ko
Cliquer pour agrandir

Les graphiques sont très utiles pour la compréhension... quand ils sont honnêtes !

Mais on peut aussi critiquer ce graphique sur le fond. Voir par exemple les quatre mensonges de Monsieur Lenglet.

Partager cet article

Pour citer cet article :

Étienne Ghys — «Graphiques frelatés» — Images des Mathématiques, CNRS, 2012

Commentaire sur l'article

Voir tous les messages - Retourner à l'article

  • Graphiques frelatés

    le 19 mars 2012 à 16:30, par Charles Boubel

    À propos du graphique tel qu’il « devrait être » : il s’agit de la comparaison de rapports dépense publique annuelle / PIB annuel. Une manière encore plus adéquate de la représenter est de faire figurer la totalité de la hauteur de la barre (ne pas couper avant les 100%). Le chiffre est un pourcentage, il correspond donc visuellement à une certaine proportion dans une barre (même si une part de la dépense publique n’est pas issue d’un prélèvement sur le PIB, mais de l’endettement vis-à-vis de créanciers étrangers). Abréger le complémentaire de la barre est aussi problématique qu’abréger la barre elle-même.

    Par exemple, des barres roses présentant les mêmes tailles relatives que dans le « vrai » graphique proposé pourraient être obtenues avec des pourcentages de l’ordre de 10% à 13,5%, ou au contraire 70% à 95% (à la louche), et donc, ne pas avoir du tout le même sens, même purement relatif les unes aux autres.

    Par ailleurs, les sondages effectués par la méthode des quotas n’ont pas de « barres d’erreur » (à tel risque fixé) au même titre que les sondages effectués sur des échantillons aléatoires grands -dans ce dernier cas, la fourchette est donnée, en gros, par le théorème limite central. C’est notamment une difficulté des sondages par méthode des quotas.

    On peut sans doute y donner un sens à une marge d’erreur, mais il faut pour cela avoir une idée de la loi suivie par la variable « pourcentage déclaratif issu du sondage ». Ceci ne peut se faire que sur la base d’une grande masse de sondages passés effectués par l’institut, par une méthode stable dans le temps, et, point le plus difficile, avec une base de comparaison sur la valeur réelle de la variable : résultat effectif de l’élection etc. Ceci doit aussi être constamment réactualisé. Quoi qu’il en soit la notion de fourchette ne peut y être définie d’une façon indiscutablement rigoureuse.

    Répondre à ce message

Laisser un commentaire

Forum sur abonnement

Pour participer à ce forum, vous devez vous enregistrer au préalable. Merci d’indiquer ci-dessous l’identifiant personnel qui vous a été fourni. Si vous n’êtes pas enregistré, vous devez vous inscrire.

Connexions’inscriremot de passe oublié ?