Je signale un billet sur le blog d’une médecin généraliste, traitant du dépistage du cancer. Il fournit d’excellents exemples d’utilisation pertinente de la statistique, et des risques de mauvais usage ou de mauvais réflexes en la matière. C’est un très bon document sur lequel s’appuyer dans un cours de statistique élémentaire en lycée ou dans le supérieur.
Un excellent billet est paru il y a peu de temps sur le tout aussi excellent bien que non-mathématique blog de jaddo, une jeune médecin généraliste.
Il traite de dépistage du cancer et de ce qu’y apporte la statistique —par exemple : non, le dépistage systématique du cancer du sein n’est pas du tout une bonne idée, malgré l’intense publicité qui lui est faite.
Outre son grand intérêt sur le sujet même qu’il traite, je lui trouve un intérêt pédagogique pour la statistique en général et c’est pour cela que je le signale. On y voit, à travers une famille d’exemples réels détaillés que :
- Oui, « les chiffres, on peut leur faire dire ce qu’on veut » : il est souvent facile d’appuyer toute thèse qu’on souhaite défendre, même fausse, par des données statistiques vraies mais bien choisies et présentées à dessein.
- Pourtant, bien utilisés, les chiffres ont un sens : la statistique permet d’évaluer les conséquences de certaines décisions et donc d’éclairer des choix, en contredisant parfois nettement l’intuition —un des traits propres de la science.
- Enfin le point précédent demande d’éviter quantité de réflexes et de raccourcis. Parfois, les impressions tirées de notre vie, de nos contacts avec nos proches, de notre intuition ou notre affectivité nous trompent complètement. Mais même sans préjugé et en se croyant rigoureux, il est très vite fait de mal interpréter des données statistiques. Le billet en donne plusieurs exemples concrets (et tiens, en voici un autre, à un milliard de dollars dit-on. Article en anglais). Il montre aussi la difficulté inattendue de mesurer certains effets statistiques. Bref, la statistique, c’est une discipline —ou au moins une petite compétence à acquérir, si on doit l’utiliser professionnellement dans des cas simples.
Les exemples donnés sont tous élémentaires, au sens où ils n’exigent pas de connaissance technique particulière. Ils demandent seulement de lire tranquillement et de réfléchir par soi-même. Ils sont typiques de points d’attention à avoir en statistique, au-delà des recettes à apprendre. Enfin ils ont l’immense avantage d’être réels et même de nous toucher tous 2Y voir cependant sur un détail le commentaire de Keer, que jaddo remercie plus bas et auquel elle répondra dans une version améliorée de son billet. (les exemples artificiels ad hoc me lassent, même si j’en ai parfois commis moi-même par nécessité). Un excellent document pour faire réfléchir et même calculer des élèves ou étudiants dans un cours de statistique de base, au lycée ou à l’université.