Faut-il arrêter d’enseigner les statistiques au lycée ?

Le 1er septembre 2012  - Ecrit par  Pierre Colmez Voir les commentaires (16)
Lire l'article en  

Dans un précédent billet,
j’ai émis l’opinion que l’introduction
des statistiques, conjuguée à la diminution des horaires, avait
largement contribué à l’appauvrissement de l’enseignement
des mathématiques au lycée. Deux collègues ont fait part de
leur désaccord avec ce constat et je voudrais revenir sur la question.
Disons tout de suite qu’il y a au moins une troisième force
à l’œuvre, à savoir un souci (venant d’où ?) de faire disparaître tout ce
qui pourrait poser problème, ce qui conduit à
la suppression de notions qui demanderaient aux élèves
de faire preuve d’initiative plutôt que de se comporter
comme des machines. Par exemple, l’intégration par partie
demande de choisir quelle fonction on va intégrer et quelle
fonction on va dériver, et il est donc naturel qu’elle
passe à la trappe (après l’arithmétique, la géométrie
(le monde n’est pas constitué que de droites et de plans...),
la combinatoire ou même l’analyse où l’on « se limite à une approche intuitive de la continuité et on admet que les fonctions usuelles sont continues par intervalle » [1]).

Je pense que personne n’aurait l’idée de nier que
les statistiques jouent un rôle de plus en plus important
dans des domaines de plus en plus variés. Lors des déjeuners de l’institut dont
j’ai parlé il y a quelque temps, il n’était pas rare de
voir les méthodes statistiques montrer le bout de leur nez dans
les exposés. Je me souviens en particulier d’une astrophysicienne
qui essayait d’évaluer la masse d’énormes filaments de matière noire
à des distances donnant le vertige. Pour ce faire elle utilisait le fait
qu’une telle masse déforme l’image des galaxies se trouvant derrière, et donc qu’une
analyse statistique des
rapports des petits et grands axes des ellipses permet d’estimer la masse ; de la magie noire !
Dans le même genre d’idée, en tant que joueur de go,
j’ai été très impressionné par le triomphe
de la bêtise artificielle sur l’intelligence artificielle.

Il semble donc raisonnable de commencer l’étude
de la statistique [2] assez tôt.
Le problème est que la statistique repose sur des mathématiques
parfaitement non triviales, en particulier le théorème
de la limite centrale (qui dit que tout fournit une gaussienne
si on le répète suffisamment de fois ; 1000 fois semble suffire si
on en croit le programme) dont le théorème de Moivre Laplace
est une première approximation (l’énoncé—pas la démonstration—de ce théorème
est au programme de terminale, ce qui me semble parfaitement
surréaliste vu le niveau du reste du programme [3]).
Il n’y a pas que la démonstration du théorème
de Moivre Laplace qui soit admise :
comme les coefficients binomiaux n’ont plus rien à voir
avec les coefficients du binôme, on est forcé d’admettre
les formules sur l’espérance et la variance de la loi binomiale,
ce qui est quand même fort stupide. De fil en aiguille, on s’aperçoit
que la totalité
des énoncés portant sur les statistiques et les probabilités sont admis,
ce qui transforme le cours de mathématiques
en un cours de mauvaise magie (à l’opposé de la magie des mathématiques
que j’évoquais dans mon billet précédent dont le ressort était
bien l’explication des phénomènes). Si on conjugue cela avec le flou
entourant les définitions d’analyse, on arrive au résultat paradoxal
que les
bons élèves ne comprennent plus vraiment ce que l’on attend
d’eux et que beaucoup doivent attendre d’arriver en classe préparatoire
pour enfin avoir l’impression qu’on leur offre un discours compréhensible.

La plupart des « capacités attendues » sont parfaitement déprimantes.
Il est possible que l’on puisse quand même faire
des choses intéressantes grâce à
« l’utilisation de la loi binomiale pour une prise de décision à partir d’une fréquence ».
Je ne sais pas ce que cela donne dans les classes, mais les
questions de ce genre sont souvent
piégées [4].
Sans avoir recours à des exemples aussi extrêmes
que celui du procès Puckett, il faut bien
voir qu’une décision fondée sur des considérations
statistiques se heurte à des obstacles de nature psychologique
 [5],
et on peut arriver à devoir utiliser un argument d’autorité
pour justifier la solution ce qui est le plus mauvais service
que l’on peut rendre à l’enseignement des mathématiques.

Il me semble donc, vu le volume horaire dont on dispose,
qu’il vaut mieux isoler quelques slogans du genre « si on répète suffisamment de fois le même évènement, alors la distribution que l’on obtient est une gaussienne » ou
encore [6]
« une variation supérieure à la racine carrée de l’échantillon est statistiquement significative ; ce n’est pas une question de pourcentages : par exemple une augmentation du nombre des naissances de 10 000 (sur 800 000) est un évènement qui mérite qu’on s’y arrête », que l’on pourrait
inclure dans un cours de sciences sociales
ou d’économie [7] où les statistiques seraient nettement plus
à leur place. On pourrait s’inspirer de ces vidéos que je
trouve assez fantastiques (la première souligne un certain nombre
de problèmes intéressants concernant l’utilisation des
statistiques (par exemple l’intérêt de découper en quartiles
et de ne pas se contenter de la moyenne) ; la seconde est plus spectaculaire).
Les mathématiques interviennent partout ;
c’est bien leur problème car
chacun aimerait transformer le
cours de maths en le cours des maths qui lui servent (comme l’acquisition
de notions mathématiques est toujours assez douloureuse pour une
majorité d’élèves, il est nettement préférable que d’autres
se chargent de les leur inculquer). Or ce qui sert
est assez différent suivant que l’on est physicien, informaticien,
économiste ou biologiste, et donc le cours de mathématiques
devient l’enjeu de luttes de pouvoir [8]
qui dépassent largement
les mathématiciens [9] qui, eux, aimeraient bien pouvoir offrir
un cours cohérent sur lequel n’importe qui pourrait s’appuyer.

Notes

[1La colonne « commentaires » du B.O est parfaitement
déprimante...

[2Jusqu’au commentaire
de Jean-Pierre Raoult, j’ignorais que l’opposition entre
« la mathématique » et « les mathématiques » avait
fait des émules.

[3J’ai
essayé de comprendre ce que « la proportion $p$ est élément de l’intervalle $[f-1/\sqrt{n},f+1/\sqrt{n}]$ avec un taux de confiance de plus de 95%, où $f$ désigne la fréquence observée sur un échantillon de taille $n$ » signifiait exactement, et je dois admettre
que je n’y suis pas arrivé : j’ai l’impression que l’on tombe sur
le problème classique où un homme sonne à la porte d’un de
ses collègues dont il sait qu’il a deux enfants ; le collègue dit
à l’un des ses enfants d’aller ouvrir la porte et une fille se présente ;
quelle est la probabilité que l’autre enfant soit une fille ? La réponse est
différente suivant que l’enfant a été désigné au hasard (auquel cas
la réponse est $1/2$) ou non (auquel cas la réponse est censée être $1/3$), enfin il
me semble...

[4Pour illustrer ceci, rien ne
vaut un procès comme celui qui s’est tenu aux États-Unis,
en 2008, concernant un
meurtre avec violences sexuelles commis en 1972 sur la personne de Diana Sylvester ; le dossier
avait été réouvert en 2003 grâce à l’arrivée de nouvelles
technologies permettant d’analyser les traces d’ADN d’un
échantillon du sperme de l’assassin conservé depuis 30 ans.
Comme l’échantillon était en assez mauvais état, les informations
qu’il contenait correspondaient à 1 personne sur 1,1 million.
La police a ensuite cherché dans une base
de données de 330 000 personnes impliquées dans des
affaires du même genre, et a trouvé exactement
1 suspect potentiel du nom de John Puckett.
L’accusation a expliqué aux jurés qu’il y avait une
chance sur 1,1 million pour qu’une personne prise au hasard ait le même ADN
que l’assassin sans être l’assassin et donc que Puckett
était coupable ; la défense a essayé d’expliquer
(apparemment, on ne lui a pas donné l’autorisation de le faire)
qu’en testant 330 000 personnes, on avait pas loin
d’une chance sur 3 de condamner un innocent... Je laisse aux
lecteurs d’Images des Maths le soin de démêler le vrai du faux
(dans la vraie vie, Puckett a été condamné).

[5Je connais quelqu’un qui a survécu à un grave accident de
voiture parce qu’elle ne portait pas sa ceinture de sécurité — cela
lui a permis d’être éjectée et donc pas écrasée — et vous
n’arriverez pas à la convaincre qu’il vaut mieux boucler sa ceinture.

[6J’ai entendu ce slogan dans la bouche de Claudine
Schwartz au colloque Maths à venir 2009 ; je l’avais trouvé
particulièrement frappant car elle avait fait remarquer
que les journalistes raisonnent systématiquement en termes de pourcentages.

[7Il me semblait que la création d’un tel cours
était la raison de la disparition de l’histoire et de la géographie
en terminale scientifique.

[8L’examen des programmes
actuels laisse entendre que le pouvoir n’est pas vraiment aux mains des physiciens.

[9Pas tous ; certains semblent penser
que cela fera progresser la cause de la branche dans laquelle ils travaillent
s’ils arrivent à l’imposer au lycée au détriment d’autres ; il n’est
pas sûr que ce soit un excellent calcul.

Partager cet article

Pour citer cet article :

Pierre Colmez — «Faut-il arrêter d’enseigner les statistiques au lycée ?» — Images des Mathématiques, CNRS, 2012

Commentaire sur l'article

Voir tous les messages - Retourner à l'article

  • Faut-il arrêter d’enseigner les statistiques au lycée ?

    le 9 septembre 2012 à 19:50, par Arnaud Lionnet

    Je voulais répondre au précédent billet, « faut-il arrêter d’enseigner les maths à l’école ? » ; j’étais d’accord avec la grande partie du texte, mais je voulais réagir à propos des statistiques. J’ai un peu laissé passer, faute de temps pour répondre, mais il semble que ce point en ait accroché plusieurs.

    Je suis assez d’accord avec le fait que, si l’on enseigne les maths au lycée, autant le faire bien (càd avec un peu d’abstraction ici et là). Et je suis tout à fait d’accord avec la remarque de Pierre Colmez : si on commence à n’enseigner des maths que les parties utiles dans la vie de tous les jours, il n’y a pas de raison de ne pas appliquer ça à toutes les matières, et on se retrouve vite à se dire : « non, ce n’est pas ça que l’école doit faire ».
    Et à mon sens c’est la question à laquelle on revient toujours dès qu’il y a une discussion sur ce qui est enseigné à l’école (en maths comme dans les autres matières). Que veut-on de l’école ?

    Je suis tout à fait d’accord sur le fait que les maths doivent donner une culture (mathématique).
    Mais une des choses que l’école doit aussi faire, à mon avis, c’est aussi former des citoyens. Donner certaines clés pour comprendre le monde. Et pour éviter de se faire rouler grossièrement (le classique « réduction de 20% supplémentaire sur la réduction de 20%, soit 40% de réduction »).
    Et donc je trouve qu’il est à peu près indispensable de faire des statistiques au lycée. Elles sont omniprésentes dans la vie de tous les jours, surtout dans les grand media (on a vu pendant les élections des sondages à tout va).

    Il n’est pas nécessaire d’avoir tous les outils pour aborder certaines notions. Les mathématiques peuvent se construire depuis la (une) racine. Mais même (voire surtout) à niveau professionnel, on se fiche souvent de pouvoir refaire toute la théorie soit-même. On part de quelque part, on admet que tel ou tel objet marche comme ça, et de là on suit une autre histoire avec ces rudiments de compréhension. Je pense qu’on peut vraiment familiariser des lycéens à des faits comme la loi des grand nombres ou le théorème central de la limite. Et au moins si des élèves sortent de terminale et se souviennent quelques années après de ce qu’est un sondage, et du fait que pour un échantillon de 1000 personnes, un sondage donne un intervalle de plus ou moins 2-3 points autour d’une valeur, dans lequel la vraie valeur se trouve avec une probabilité de 95%, c’est déjà pas si mal (s’ils se souviennent de l’histoire du racine de n et sont capables de donner la taille de l’intervalle pour un sondage sur 100 personnes, c’est encore mieux mais pas nécessaire).

    Par ailleurs, c’est un des attributs des statistiques de faire dire des choses à un tas de données. A commencer ne serait-ce que par permettre de représenter des données (la statistique descriptive est tout aussi importante que la statistique inférentielle). Donc c’est quelque part donner un vrai goût de ce que sont les statistiques que de travailler avec des données extérieures.

    Répondre à ce message

Laisser un commentaire

Forum sur abonnement

Pour participer à ce forum, vous devez vous enregistrer au préalable. Merci d’indiquer ci-dessous l’identifiant personnel qui vous a été fourni. Si vous n’êtes pas enregistré, vous devez vous inscrire.

Connexions’inscriremot de passe oublié ?