Cent pour cent des gagnants ont tenté leur chance

Écrit par Jean-Marc Schlenker

Publié le 6 janvier 2009

Récemment Valérie Pécresse, ministre de l’enseignement supérieur et de la recherche, a écrit ceci : « Je suis bien sûr favorable à ce que les maîtres de conférences aient une perspective de carrière et deviennent professeurs [1]. D’ailleurs, c’est souvent le cas puisque plus de 80% des professeurs sont d’anciens maîtres de conférences. » Bien sûr, l’argument est spécieux : qu’une forte proportion des professeurs soient d’anciens maîtres de conférence ne veut pas dire qu’une forte proportion des maîtres de conférence deviennent professeurs !

Je ne souhaite pas m’attarder sur cette erreur de raisonnement classique et néanmoins regrettable, mais plutôt voir comment on peut parfois tout de même relier deux grandeurs « duales » comme ces deux proportions.

Nombre de partenaires

Régulièrement, des enquêtes sur la vie sexuelle des Français relèvent de très fortes disparités entre le nombre moyen de partenaires sexuels chez les hommes et chez les femmes. Ainsi, une étude récente donne un résultat de 4,4 pour les femmes contre 11,6 pour les hommes. On y lit toutefois une mise en garde : « De tels écarts entre les femmes et les hommes traduisent avant tout le fait que les hommes comptent généralement l’ensemble de leurs partenaires, alors que la plupart des femmes ne retiennent quant à elles que les partenaires qui ont compté dans leur vie et qui correspondent à ce qu’elles estiment qu’une relation doit être. »

Pourquoi considérer ainsi que les réponses données par les sondés ne sont pas fiables, alors que cette fiabilité a fait l’objet de grandes attentions lors de cette enquête ? Certainement parce que ces résultat ne peuvent pas représenter la réalité. Voyons pourquoi.

Si on néglige les relations homosexuelles et avec des individus hors de la population (les personnes décédées entre temps, par exemple), on peut représenter les relations sexuelles par un « graphe biparti [2] » : on place d’un côté un « sommet » pour représenter chaque femme de la population française, d’un autre côté un sommet pour chaque homme, et on trace une « arête » entre un homme et une femme s’ils ont eu une relation sexuelle.

Introduisons quelques notations. Soit d’abord \(h\) le nombre d’hommes, \(f\) le nombre de femmes, et \(c\) le nombre d’arêtes (couples). Enfin, on note \(P_h\) le nombre moyen de partenaire des hommes, et \(P_f\) le nombre moyen de partenaires des femmes. L’enquête semble indiquer que \(P_f=4,4\) et \(P_h=11,6\).

Comptons maintenant pour chaque homme le nombre de ses partenaires sexuels, et faisons la somme pour tous les hommes. On obtient exactement \(c\), car chaque arête correspond à une partenaire pour un homme. Donc le nombre moyen de partenaires des hommes est \(P_h=c/h\), ce nombre total divisé par le nombre d’hommes. De la même façon, le nombre moyen de partenaires des femmes est \(P_f=c/f\).

En particulier, on obtient :
\[\frac{P_h}{P_f}=\frac{c/h}{c/f}=\frac{f}{h}\]
Or l’enquête citée donne \(\frac{P_h}{P_f}\simeq 2,6\) et les chiffres de l’INSEE en gros \(\frac{f}{h}\simeq 1,1\) !

Bien sûr, on a fait quelques hypothèses, mais l’écart entre ces deux rapports semble trop important pour leur être entièrement attribué, et on est incliné à penser que les résultat de cette enquête ne sont pas fiables.

Facteur d’impact

Pour revenir au sujet très actuel des facteurs d’impact des journaux scientifiques (voir la note d’Étienne Ghys pour une définition), voyons comment la même analyse peut être faite pour expliquer pourquoi il varie d’un domaine de recherche à l’autre.

Disons par exemple qu’on considère la chimie, et construisons un graphe biparti ainsi : d’un côté, on place un sommet pour chaque article publié dans un journal de chimie de la liste de l’ISI en 2007 de l’autre on place un sommet pour chaque tel article publié en 2005 ou 2006. On place une arête entre un article de 2007 et un article de 2005-2006 si le premier cite le second.

Soit \(a\) le nombre d’articles publiés en 2007, \(b\) le nombre d’articles publiés en 2005 et 2006 et \(c\) le nombre d’arêtes (citations).
Le nombre moyen de fois qu’un article de chimie de 2005-2006 est cité
(par un article de 2007) est noté \(D\) et le nombre moyen de citations
issues d’un article de 2007 (vers un article de 2005-2006) est noté \(E\).

Comme précédemment, on voit que le nombre total de citations reçues
par les articles de 2005-2006 est \(c\), donc le nombre moyen
est \(D=c/b\). D’autre part, le nombre total de citations
venant des articles de 2007 est également \(c\), donc leur nombre moyen
est \(E=c/a\). On obtient que \(c=E\times a\) et donc
\[D = E \frac{a}{b}\]
Cette formule simple montre que le facteur d’impact moyen des articles dépend de la croissance du nombre d’articles publiés (à travers le facteur \(a/b\)) et
du nombre \(E\) moyen d’articles de moins de deux ans qui sont cités par un article donné.
On pourrait dire que le facteur \(a/b\) détermine la vitalité du domaine,
et qu’il n’est pas choquant que l’impact moyen \(D\) en dépende.
Par contre \(E\) ne représente que les habitudes de citations :
dans certains domaines, on cite beaucoup d’articles très récents,
alors que dans d’autres on a tendance à citer moins d’articles, plus anciens. Ces différences de pratique influencent énormément les facteurs d’impact des articles, sans avoir de rapport avec l’impact réel des publications. Le facteur d’impact est donc inutilisable en l’état pour comparer différents domaines.

Bien sûr, le modèle proposé contient plusieurs approximations : par exemple, l’ISI recense aussi les citations entre deux domaines différents ; de plus les facteurs d’impact sont calculés par journal et pas par article. Toutefois, la correction qu’il faudrait apporter à la formule ci-dessus pour tenir compte de ces approximations est certainement très faible comparée aux grandes variation de \(E\) entre les domaines.

Commentaires

Écrire un commentaire

Il est possible d’utiliser des commandes LaTeX pour rédiger des commentaires — mais nous ne recommandons pas d’en abuser ! Les formules mathématiques doivent être composées avec les balises .
Par exemple, on pourra écrire que sont les deux solutions complexes de l’équation .

Si vous souhaitez ajouter une figure ou déposer un fichier ou pour toute autre question, merci de vous adresser au secrétariat.

Cent pour cent des gagnants ont tenté leur chance

SOMMAIRE

Nombre de partenaires

Facteur d’impact

ÉCRIT PAR

Jean-Marc Schlenker

Commentaires

Écrire un commentaire