Coincidencias

Piste verte Le 20 janvier 2011  - Ecrit par  François Sauvageot
Le 5 avril 2022  - Traduit par  Edgard Araya, Andrés Navas, Pilar Garcés
Article original : Coïncidences Voir les commentaires
Lire l'article en  

Es fácil sorprenderse con hechos que sugieren que algo extraordinario acaba de ocurrir, con coincidencias que crees que son totalmente improbables. A veces, las inversiones de la intuición (apodadas paradojas) muestran que debemos tener cuidado con el sentido común, especialmente cuando se trata de la justicia.

Dos ejemplos

Alguien anuncia fríamente a su audiencia que da por sentado que dos de ellos nacieron el mismo día, o que sus padres se casaron el mismo día, etc.
Esto no es nada extraordinario : la probabilidad de que esto sea cierto depende del número de personas : si son 23, ya es del 50%, y si hablamos con 50 personas, ¡ya no hay más de un 3% de posibilidades de equivocarse !

En la misma línea, un médium anuncia para los próximos tres años 169 fechas para las que habrá terremotos de magnitud superior a 6,5. Vemos después del hecho de que, de los 196 terremotos que realmente ocurrieron, 33 habían sido predichos por el médium. Ahora bien, la probabilidad de tener 33 éxitos en esto es solo del 7,1%. Sin embargo, no hay nada extraordinario en esto. ¿Por qué ?

Explicaciones

Incluso si los hechos descritos son raros cuando se consideran individualmente o, mejor dicho, si son eventos aislados, es diferente si se repite la experiencia o si se les da varias veces la oportunidad de hacerse realidad.

La clave es considerar la cantidad de veces que ocurrirá un evento raro si se espera lo suficiente. Si todos los días tenemos una posibilidad entre 10 de perder una conexión de transporte, nos decimos a nosotros mismos que a fin de mes, la habremos perdido unas dos veces (tomando el transporte unos 20 días al mes). Esto es burdo pero es un buen estimador de lo que es normalmente raro en contraposición a lo que es realmente muy excepcional.

En cuanto a las fechas, dos días del año tomados al azar coinciden una vez en 366. Si nos damos una lista de 50 días, ¿cuántas veces podemos realizar nuestro experimento que, a su vez, solo requiere comparar dos días entre ellos ? En otras palabras, ¿cuántos pares de fechas podemos formar a partir de una lista de 50 fechas ? La respuesta es mucho mayor de lo que imaginamos a primera vista : podemos formar 1225 pares de días de esta lista de 50... ¡y 1225 es más de tres veces mayor que 366 !

Hagamos los cálculos por completo, considerando los años bisiestos.

  • Con dos personas en la asamblea, tenemos $366\times 366$ fechas posibles para la lista de dos cumpleaños. De estas fechas, $366\times 365$ no corresponden a una fecha coincidente, mientras que las 366 restantes sí corresponden.
  • Con tres personas, la lista de posibles fechas es $366\times 366\times 366$, las fechas sin coincidencias son $366\times 365\times 364$, ya que la primera fecha puede resultar cualquiera, la siguiente diferente a la primera y la última diferente de las dos primeras.
  • Con $50$ personas, el mismo razonamiento lleva a un recuento de $366^{50}$ listas posibles y a $366\times 365\times\cdots\times (366-50+1)$ listas sin coincidencias.

Si admitimos que todas las listas tienen la misma probabilidad de ocurrir (lo cual no es del todo razonable), al hacer la razón entre el número de casos desfavorables y el número de casos posibles obtenemos una probabilidad de
\[\frac{366}{366}\times\frac{365}{366}\times\cdots\times\frac{366-50+1}{366}\]
de estar equivocado. Así verificamos que con 50 personas esta probabilidad es del 2,96%, es decir, una probabilidad de éxito superior al 97%.
Para 23 personas, encontramos una probabilidad de equivocarnos ligeramente inferior al 50%.

En cuanto al médium, ¡la probabilidad de que haya entre 20 y 40 aciertos es de aproximadamente el 98% ! Sin embargo, el médium no había anunciado exactamente 33 éxitos... De hecho, si hubiera obtenido más de 40 predicciones correctas o menos de 20, habría sido sorprendente. Ahora que lo pienso, si el médium no hubiera tenido éxito, ¡entonces sí uno debería haberse maravillado !

Algunas consecuencias - Las pruebas de ADN

La prueba de ADN más popular es el análisis de micrositios. Estas regiones del ADN están ubicadas en partes no codificantes, que varían mucho de un individuo a otro (hablamos de polimorfismo). La forma de cada micrositio es común en alrededor del 5 al 20% de la población. Pero el mapa completo formado por el análisis de 11 a 16 micrositios probados es casi único, una especie de ’’código de barras genético’’, excepto que no se garantiza que dos personas tengan necesariamente códigos de barras genéticos diferentes.

Y aquí es donde debes tener cuidado : ¡probar no es identificar ! A partir de dos muestras, una prueba positiva da una probabilidad de que sean de la misma persona. Una prueba negativa le permite estar seguro de que este no es el caso.

De este modo, terminamos con una especie de paradoja bastante impresionante : cuanto más aumentamos el tamaño del archivo, ¡más seguros estamos de que contendrá duplicados ! Esto significa que, incluso si llegamos a una prueba muy confiable (digamos una posibilidad en unos pocos millones de tener el mismo perfil que otra persona), manteniendo a todos separados (de hecho, unas pocas decenas de miles son suficientes) estamos seguros de tener duplicados.

En materia de justicia, la prueba de ADN es ante todo una confirmación (o una negación) de una investigación ya realizada, y no un medio para encontrar a los culpables. Archivar a todas las personas, además de los problemas éticos que plantea, sería sobre todo una puerta abierta a la arbitrariedad y la injusticia.

Pruebas de ADN y falacia del fiscal

En un caso criminal, se recolecta parte del ADN. Una sola parte del ADN no permite identificar claramente todos los micrositios que forman el código de barras genético del sospechoso. La frecuencia de tal pieza de ADN es, digamos, alrededor de 1/10000.

¿Podemos suponer que solo hay una posibilidad entre 10000 de equivocarse al acusar a un sospechoso con este perfil ?

¡ NO !

Si FNAEG tiene 20.000 entradas, ¡hay un 86% de posibilidades de encontrar al menos dos veces a ese perfil ! ¡Eso es significativamente más de una de cada dos posibilidades de inculpar a una persona inocente !

Esta confusión es frecuente [1]. Así, en noviembre de 1999, en el Reino Unido, Sally Clark [2] fue acusada de matar a sus dos hijos : Christopher de 11 semanas en diciembre de 1996 y Harry de 8 semanas en enero de 1998. En ausencia de pruebas, el profesor de pediatría Meadow, experto judicial, utilizó el siguiente argumento falaz :

’’La probabilidad de que ambos bebés murieran a causa del síndrome de Muerte Súbita en lactantes es muy, muy baja, 1 en 73 millones. Es como si un caballo extranjero, al que las casas de apuestas dan por perdedor 80 a 1, ganara el Grand National 4 años seguidos’’.

Por tanto, el profesor Meadow sugiere que la probabilidad de que el síndrome de Muerte Súbita en lactantes golpee a la misma familia dos veces también representa la probabilidad de la inocencia de Sally Clark. Esto está completamente mal.

Para evaluar esta probabilidad de inocencia, debemos buscar el número de veces que ocurre un evento extremadamente raro en una población muy pequeña (la de los que han sufrido dos muertes) y no el número de veces que ocurre lo mismo en la población total.

Es difícil calcular con precisión esta probabilidad. Un cálculo utilizando el hecho de que en el Reino Unido puede haber alrededor de 30 infanticidios y 650 mil nacimientos por año, permite obtener que la probabilidad de que Sally Clark sea inocente ¡es mayor que 2/3 ! [3]

Pero de todos modos, sea cual sea el resultado, ninguna conclusión sería legítima para eso. ¿Juegas tu inocencia en una lanzamiento de dados ? Auguste Comte incluso argumentó que la aplicación del cálculo de probabilidades a las ciencias morales es el escándalo de las matemáticas, porque Laplace y Condorcet, que calcularon bien, ¡llegaron a resultados sin sentido común ! [4]

Teorema del dictador

La frase de Auguste Compte se refiere en particular a la paradoja de Condorcet, acerca de la dificultad de votar sobre tres opciones, paradoja generalizada por Arrow y conocida como el teorema del dictador. Podemos hacernos una idea pensando en el juego ’’Piedra, papel, tijeras’’ : ningún objeto gana sobre los otros dos porque cada objeto le gana a otro y es vencido por el tercero. ¿Cómo elegir en tal situación ?

Para evitar este tipo de situación, principalmente votamos sólo sobre dos posibilidades. Y luego debemos darnos cuenta de que la elección de la cuestión es decisiva : es el acto político crucial. En cierto modo, la pregunta contiene parte de la respuesta en sí misma : al descartar otras posibilidades y restringirse a una alternativa con dos ramas, ya se ha tomado gran parte de la decisión. Si tenemos la posibilidad de elegir entre un aeropuerto en tal o cual lugar o ningún aeropuerto, ¿podemos ofrecer un aeropuerto en otro lugar ? Si proponemos una Unión Europea en torno a la moneda o rechazar una Unión Europea, ¿podemos proponer una Unión Europea en torno a otra base ? ¡Pues no ! Por ello, es necesario saber qué votar (o no votar) para tener la oportunidad de llevar a cabo un proyecto diferente ... sabiendo que al legitimar tal o cual proyecto ponemos en gran riesgo la posibilidad de promover otro, incluso argumentando que la elección fue demasiado limitada durante la votación.

Ante tal elección, los ciudadanos deben reflexionar no solo sobre la pregunta propuesta, sino también sobre otras opciones que podrían haberse considerado como posibles. Y cuando, como en las elecciones a dos vueltas, son ellos mismos quienes determinan quién estará en la segunda vuelta y, por tanto, cuál será la pregunta que se plantee, también deben pensar detenidamente en las opciones ; esto incluso si también podemos decir que una primera ronda permite dar una señal a los dos candidatos que logran pasar a la segunda ronda.

En cuanto a los analistas, solo podemos recomendar prudencia cuando deduzcan del resultado de una votación que responda a otra pregunta, como por ejemplo equiparar un voto en contra de una acción de política exterior a una sanción a raíz de una política interna impopular. A menudo es mucho más complicado que eso.

Para más información...

Algunas críticas a los modelos

Se asumió que todas las fechas o todos los eventos eran equiprobables. Si uno piensa que este no es el caso, entonces, de hecho, las probabilidades de coincidencia aumentan. Por ejemplo, si tienes gemelos, o si todos nacieron en agosto... Todo esto tiene el efecto de restringir las posibles listas y, por lo tanto, aumentar las posibilidades de tener duplicados.

Triángulo de Pascal

En las consideraciones sobre los hechos anunciados de antemano, estudiamos el número de casos favorables repitiendo un experimento varias veces. Para ello, debemos contar el número de formas posibles de elegir un número fijo de fechas desde una lista grande. Por ejemplo, con una lista de 169 fechas, ¿cuántas opciones posibles hay para extraer 33 ? ¡ Este número es muy grande ! Se llama número de combinaciones. Los números de combinaciones aparecen en el triángulo de Pascal y en la fórmula binomial de Newton. Cuando dibujamos la forma del triángulo de Pascal para $n$ grande [5], encontramos una curva de campana, y es por eso que podemos aproximar un número de combinaciones por un exponencial.

Más precisamente, tenemos la siguiente estimación :
\[exp\left(-\frac{t^2}{m-t+1}\right)\leq \frac{{2m\choose m-t}}{{2m\choose m}} \leq exp\left(-\frac{t^2}{m+t}\right)\;.\]
Una consecuencia es, por ejemplo, que los 107 términos intermedios de la milésima fila, por sí solos, contribuyen al 99% del total de los 1001 términos de la fila.

Paradoja de los cumpleaños y las pruebas de ADN

Si denotamos por $P(k)$ la probabilidad de que todas las personas en una lista de $k$ personas nacieran en un día diferente, también podemos compararla con una exponencial. De hecho, podemos demostrar -gracias a la concavidad del logaritmo- que tenemos (bajo el supuesto de equiprobabilidad) :
\[exp\left(-\frac{k(k-1)}{2(366-k+1)}\right)\leq P(k)\leq exp\left(-\frac{k(k-1)}{2\times366}\right)\;.\]
Si también estuviéramos interesados ​​en el momento del nacimiento, tendríamos que reemplazar $366$ por $366\times 24 = 8784$ en las fórmulas.
Si tomamos por ejemplo $1600$ personas, ¡hay más del 90% de posibilidades de que dos personas nazcan el mismo día, la misma hora y el mismo minuto !
Evidentemente, aún sería necesario conocer con precisión su minuto de nacimiento.

Falacia del fiscal

Hicimos dos suposiciones : ($A$) los hijos de Sally Clark murieron por accidente, ($M$) Sally Clark los mató, olvidamos las otras posibilidades. Para evaluar la probabilidad de la inocencia de Sally Clark ($I$), debemos evaluar la posibilidad de que haya una doble muerte inexplicable ($A$) sabiendo que hay una doble muerte ($D$). Denotamos por $P(A|D)$ la probabilidad del evento ($A$) sabiendo que el evento ($D$) ha tenido lugar y usamos la fórmula de probabilidad condicional :
\[P(A|D)=\frac{P(A)P(D|A)}{P(A)P(D|A)+P(M)P(D|M)}=\frac{P(A)}{P(A)+P(M)}=\frac{1}{1+\frac{P(M)}{P(A)}}\;.\]
Al tomar 1/1300 como probabilidad de síndrome de Muerte Súbita del lactante, podemos pensar que $P(A)$ es mayor que 10 veces $(1/1300)*(1/1300)$, o $P(A)$ mayor que 1/169000. El factor 10 representa el mayor riesgo de tener un segundo síndrome de muerte súbita del lactante sabiendo que ya ha habido uno. El estadístico Ray Hill realizó cálculos que muestran que el factor 10 es un compromiso entre las estimaciones que dan un factor de riesgo aumentado entre 5 y 22.

Con 30 infanticidios por año y 650 mil nacimientos por año, podemos pensar que $P(M)$ es menos de 1/20 veces 30/650.000, o $P(M)$ menor que 3/1.300.000. Este factor de 1/20 es muy empírico. Hill dice que si se ha cometido un asesinato, es más probable un segundo, significativamente más probable que si no hubiera habido uno antes. Si no lo ponemos, tendríamos que calcular 30/650.000 al cuadrado ; en otras palabras, tendríamos que multiplicar 30/650.000 por sí mismo, es decir, un número aproximadamente igual a 1/20.000. Consideramos aquí que el riesgo excesivo del infanticidio es como máximo 1000. Ray Hill lo estima en 176, que ya es enorme.

Obtenemos : [6].
\[P(A|D)\ge\frac{1}{1+0,39}\simeq72\%\ge2/3\;.\]
Por lo tanto, la probabilidad de que Sally Clark sea inocente es, con nuestras hipótesis de trabajo, mayor que 2/3. [7]

Post-scriptum :

El equipo editorial de Paisajes Matemáticos, así como el autor, agradecen su cuidadosa revisión a los editores cuyos seudónimos son los siguientes : Olivier, Caocoa, Serma, Jérôme Buzzi y Massy Soedirman. El autor también agradece a Patrick Popescu-Pampu por sus comentarios pertinentes, sus sugerencias y sus preguntas.

Article original édité par Patrick Popescu-Pampu

Notes

[1El estadístico Peter Donnelly dio una conferencia sobre este tema. Está en inglés, pero tiene subtítulos en francés : http://www.ted.com/talks/peter_donn....

[2Para más información, consulte por ejemplo, en inglés, aquí y acá

[3Sally Clark fue condenada a cadena perpetua en 1999 y luego liberada en 2003 después de dos apelaciones. Murió de alcoholismo a la edad de 42 años, en 2007, sin haberse recuperado nunca de esta historia.

[4Citado por Henri Poincaré en una carta a Paul Painlevé, durante el caso Dreyfuss.

[5Es decir, el histograma asociado : en una línea graduada de $0$ a $n$, colocamos rectángulos adyacentes, de idéntica base y altura $n\choose k$, al nivel de la graduación $k$. Aquí está el histograma para $n=18$.

[6Los cálculos de Ray Hill enmarcan esta probabilidad entre 82% y 90% ; en otras palabras, muestran que la tasa de muertes súbitas dobles en comparación con la tasa de infanticidios dobles está entre 1 y 2 para la primera contra 9 para la segunda

[7Para cálculos detallados, en inglés, consulte el artículo de Ray Hill publicado en 2004 en Pediatric and Perinatal Epidemiology , vol. 18, págs. 320–326.

Partager cet article

Pour citer cet article :

Andrés Navas, Edgard Araya, Pilar Garcés — «Coincidencias» — Images des Mathématiques, CNRS, 2022

Crédits image :

Image à la une - La ilustración es de propiedad del autor.

Commentaire sur l'article

Laisser un commentaire

Forum sur abonnement

Pour participer à ce forum, vous devez vous enregistrer au préalable. Merci d’indiquer ci-dessous l’identifiant personnel qui vous a été fourni. Si vous n’êtes pas enregistré, vous devez vous inscrire.

Connexions’inscriremot de passe oublié ?