Bayes y las pruebas de detección de enfermedades

El teorema de Bayes es uno de los teoremas más conocidos y más importantes relacionados con probabilidad. Es uno de esos resultados que por su sencillez y su utilidad deberían ser conocidos por todos. ¿Utilidad? Sí, utilidad. Y no me refiero solamente a utilidad dentro de las matemáticas, sino utilidad práctica en nuestra vida. Concretamente vamos a ver que el teorema de Bayes nos ayuda a ser un poco más optimistas en el caso de que cierta prueba diga que es casi seguro que padezcamos una enfermedad seria.

Pero vamos por partes. Creo que para comenzar lo más adecuado es enunciar dicho teorema. Ahí va:

Teorema de Bayes:

Supongamos que nuestro espacio de referencia U puede expresarse como unión de una cierta cantidad de sucesos \{A_1,A_2,\ldots,A_n \} que son disjuntos dos a dos (es decir, que ninguna pareja formada con esos conjuntos tiene elementos en común) y tal que la probabilidad de todos ellos es mayor que cero.

Supongamos que dado un suceso cualquiera B conocemos la probabilidad de que suceda B condicionado a que sucede cualquiera de los A_i, que denotamos por P(B|A_i). Entonces podemos calcular la probabilidad de que suceda cada uno de los A_i condicionado a que sucede B, P(A_i|B), de la siguiente forma:

P(A_i|B)=\cfrac{P(B|A_i) \cdot P(A_i)}{P(B)}

La probabilidad de suceso B puede expresarse de la siguiente forma (teorema de la probabilidad total):

P(B)=P(B|A_1) \cdot P(A_1) + P(B|A_2) \cdot P(A_2) + \ldots + P(B|A_n) \cdot P(A_n)

Como decía antes, un teorema muy conocido para cualquiera que haya estudiado unos mínimos de probabilidad que Thomas Bayes enunció a mediados del siglo XVIII.

Pero de todas formas puede ser un resultado poco conocido por mucha gente, y, por qué no decirlo, puede echar un poco para atrás su formulación tal cual la hemos planteado. En este momento os pido que no os vayáis, que no os marchéis sin continuar leyendo este post. Que no abandonéis la lectura de estas líneas hasta que no las hayáis terminado todas, porque si os vais no tendrá ningún sentido. Porque lo importante de este post no es lo que llevamos, sino lo que nos queda. Vamos a ver una aplicación de dicho resultado que además nos va a ayudar a ser optimistas ante una aparente mala noticia.

Estos A_i que aparecen en el teorema son un conjunto de partes en las que podemos dividir nuestra situación inicial de forma que dos partes distintas no tienen elementos en común y todas las partes juntas recomponen dicha situación. En nuestro ejemplo de aplicación del teorema, el conjunto inicial van a ser los habitantes de un país y los A_i van a ser dos: padecer una enfermedad, E (de enfermo), y no padecerla, S (de sano). Está claro que no tienen elementos comunes (no puede haber nadie que padezca y no padezca la enfermedad a la vez) y que si junto a todos los que padecen dicha enfermedad con los que no la padecen obtengo el conjunto de la población.

Supongamos que esta enfermedad es una de esas a las que todos tenemos miedo, de esas que hasta casi nos da miedo pronunciar: cáncer, SIDA, etc. Y supongamos que estamos participando en una campaña de concienciación sobre dicha enfermedad en la que se le va a realizar esta prueba a, digamos, 100000 personas.

Vamos a poner que la prueba es fiable al 95%. ¿Qué significa esto? Pues muy sencillo: que da positivo el 95% de las veces que se la hacemos a alguien enfermo y que da negativo el 95% de las veces que se la aplicamos a alguien sano. Y supongamos también que el porcentaje de personas que la padecen en realidad es el 1%. Es decir, una de cada cien personas tienen realmente dicha enfermedad.

Bueno, con todo esto nos hacemos la prueba…y el resultado es positivo. ¿Debemos venirnos abajo? ¿Debemos pensar que está todo perdido? ¿Cuál es realmente la probabilidad de que padezcamos realmente la enfermedad? La cosa parece muy clara, pero quizás no lo esté tanto.

Vamos a ponerle nombre a todo. Las probabilidades de “enfermo” y de “sano” son las siguientes:

P(E)=\cfrac{1000}{100000}=0.01 \; ; \; P(S)=\cfrac{99000}{100000}=0.99

ya que se sabe de antemano (esto suelen ser estimaciones, pero para el caso no es relevante) que el 1% de la población padece realmente la enfermedad.

Si llamamos B al suceso “dar positivo en la prueba”, tenemos que la probabilidad de dar positivo sabiendo que se está enfermo es:

P(B|E)=0.95

y que la probabilidad de dar positivo estando sano es

P(B|S)=0.05

por la fiabilidad de la prueba que teníamos al principio. Por otro lado, la probabilidad de B, por lo comentado al final de la formulación del teorema, se puede calcular así:

P(B)=P(B|E) \cdot P(E) + P(B|S) \cdot P(S)=0.95 \cdot 0.01+0.05 \cdot 0.99=0.059

Recordad que ya nos hemos hecho la prueba, y que el resultado de la misma ha sido positivo. Lo que queremos saber es qué probabilidad hay de que en realidad padezcamos dicha enfermedad a la vista de este resultado de la prueba. Es decir, queremos calcular la probabilidad de padecer la enfermedad condicionada a que el resultado de la prueba ha sido positivo, esto es, P(E|B). Y para ello utilizamos el teorema de Bayes:

P(E|B)=\cfrac{P(B|E) \cdot P(E)}{P(B)}=\cfrac{0.95 \cdot 0.01}{0.059} \approx 0.16

¡¡Un 16%!! Es decir, en un caso como el descrito hay solamente un 16% de posibilidades de padecer la enfermedad habiendo dado positivo en la prueba, porcentaje que choca tremendamente con la fiabilidad inicial de dicha prueba, que recordemos era del 95%.

¿Qué nos debe enseñar esto? Pues que siempre hay que ser cautelosos con los resultados, que no hay que perder la esperanza por algo así, ya que igual no estamos interpretando bien los números que hay detrás de estos estudios. Evidentemente habrá gente que, a la postre, en realidad tenga dicha enfermedad, pero será un pequeño porcentaje (16%) respecto al que en teoría parecía ser (95%). Así que tranquilidad, paciencia y optimismo. Y, eso sí, corriendo al médico a confirmar si padecemos la enfermedad o no, que una cosa no quita a la otra.

Y todo esto, repito, con una prueba cuya fiabilidad es del 95%. Imaginaos qué porcentaje nos saldría si la prueba tiene un 80% de fiabilidad, o un 60%, o menos (que las hay). Y que luego nos quieran vender “la máquina de la verdad” como algo de lo que nos podemos fiar…


Fuente:

  • El hombre anumérico, de John Allen Paulos.

Autor: ^DiAmOnD^

Miguel Ángel Morales Medina. Licenciado en Matemáticas y autor de Gaussianos y de El Aleph. Puedes seguirme en Twitter o indicar que te gusta mi página de Facebook.

10 Comentarios

  1. Muy interesante, aunque me cuesta encontrar referencias a que un 95% de fiabilidad implique lo que se dice, ya que entiendo que la probabilidad de falsos positivos y falsos negativos no tiene por qué ser la misma en este tipo de pruebas (5% en este ejemplo).
    Ya sé que esto era sólo un ejemplo, sólo que el sorprendente resultado me ha picado la curiosidad y me he puesto a buscar por ahí cómo se define la fiabilidad de las pruebas y no me ha quedado muy claro.

    ¡Gracias por el post!

    Publica una respuesta
  2. El teorema de Bayes es un resultado que nos ayuda a abordar problemas estadísticos desde una perspectiva distinta, en mi caso lo utilizo en estadística industrial (para evaluar el comportamiento de un proceso sin necesidad de verificar la calidad del producto), con resultados muy confiables

    Publica una respuesta
  3. El planteamiento es magnífico para demostrar que la fiabilidad real de ciertas pruebas contradice la realidad en muchos casos. Desafortunadamente muchas enfermedades graves disponen de pruebas cuyo resultado positivo confirma en un 100% la existencia de la enfermedad analizada.

    Publica una respuesta
  4. La de discusiones que he tenido por estos asuntos…

    Otra aplicación interesante es en los filtros anti-spam.

    O el famoso problema del taxi.

    Publica una respuesta
  5. Por favor suban más artículos de Estadística, porque la verdad de las cosas es que la estadística es una ciencia en constante evolución, además de que es un tema apasionante.

    Lo que me encanta de la estadística es que no es tan exacta como las matemáticas ni tampoco tan subjetiva como la filosofía. Es una alquimia muy curiosa y útil en la vida diaria.

    Muy buen artículo

    Publica una respuesta
  6. El articulo está muy bien, pero me gustaría comentar una cosa que he leído y que no me ha gustado nado dado que este es un bloc matemático:

    “Y supongamos también que el porcentaje de personas que la padecen en realidad es el 1%. Es decir, una de cada cien personas tienen realmente dicha enfermedad.”

    Eso es falso. Quiero decir, se dice muchas veces, en términos coloquiales, pero no deja de ser falso. Una de cada cien personas no tiene porque tener esa enfermedad, pueden ser 2, 3 o ninguna. Me acuerdo como nuestro profesor de estadística nos lo decía, que es la típica frase que se suelta en las noticias y que solo trae confusión a aquellos que no saben de estadística. Yo se perfectamente que cuando se habla de un 1% no significa que, exactamente, 1 de cada 100 lo cumpla, pero hay gente que si que lo entiende así. Y, dado que estamos en un blog de matemáticas, no me parece muy apropiada la frase dada su falta de rigurosidad. Espero no haber sido muy agresivo, pero creo que es un comentario que se tenía que hacer.

    Publica una respuesta
  7. Esta entrada contiene un error de bulto relacionado con el uso y abuso del teorema de Bayes aplicado a la vida cotidiana. Depende del grupo que elijas para tu P(E), el resultado de P(E|B) será más o menos preciso.
    Ya lo comenté detalladamente hace unos días, pero no apareció mi mensaje. A ver si ahora sale éste.

    Publica una respuesta
  8. Aceptando los supuestos del ejemplo planteado, y ya que no se ha dicho en ninguno de los comentarios, quiero incluir el dato (para tranquilidad de los que den negativo en una prueba con estas condiciones), de que aplicando Bayes con los correspondientes valores, la probabilidad estar sano es de 0,99946865.
    Resumiendo: se pueden esperar 5 individuos sanos entre cada 6 con resultado positivo y 1 enfermo entre cada 2000 con resultado negativo.
    Hay que concluir que una prueba con un 95% de fiabilidad no es suficientemente “fiable” para un sujeto concreto, aunque sí sirva e efectos estadísticos.

    Publica una respuesta
  9. ¡Me encantó el artículo! Una explicación bastante ligera dirigida al público general desconectado de la estadistica. Denota la abundancia de información estadistica en la vida cotidiana.

    El teorema de bayes tiene gran variedad de aplicaciones en áreas tan distantes como diversas. En BI (el área donde tengo competencia) lo usamos para buscar patrones y relaciones cuando la información histórica en las tablas de probabilidades condicionadas es inexacta o en tablas de contingencia donde la evidencia conocida está incompleta. Hasta ahora con resultados óptimos.

    Publica una respuesta

Trackbacks/Pingbacks

  1. Bitacoras.com - Información Bitacoras.com... Valora en Bitacoras.com: El teorema de Bayes es uno de los teoremas más conocidos y más importantes…
  2. Gaussianos cumple 7 años de vida - Gaussianos | Gaussianos - […] abril hablamos sobre Bayes y las pruebas de detección de enfermedades, os presentamos a Grace Murray Hopper, la mamá…
  3. (Lo que yo considero) Lo mejor de 2013 en Gaussianos | Matemáticas Secundaria - […] la regla y el compás por piezas de mecano para bisecar ¡y trisecar! ángulos Bayes y las pruebas de…
  4. Inferencia Bayesiana | pimedios - […] os gusta este tema debéis leer Bayes y las pruebas de detección de enfermedades de gaussianos, y Opiniones, hechos e inferencia bayesiana…
  5. New York Times: Algunos pueden llevar el Ebola sin mostrar ningún sintoma | La verdad conspiranoica - […] El interés práctico relacionado con el Ébola es que una tasa de 99% de verdaderos positivos (también conocida como…
  6. Diagnósticos – NOTAS A PIE DE GUERRA - […] Pues bien, esto se aplica en diagnósticos médicos. Se dice que, partiendo de que un porcentaje reducido de la…

Puedes utilizar código LaTeX para insertar fórmulas en los comentarios. Sólo tienes que escribir
[latex]código-latex-que-quieras-insertar[/latex]
o
$latex código-latex-que-quieras-insertar$.

Si tienes alguna duda sobre cómo escribir algún símbolo puede ayudarte la Wikipedia.

Y si los símbolos < y > te dan problemas al escribir en LaTeX te recomiendo que uses los códigos html & lt; y & gt; (sin los espacios) respectivamente.

Envía un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *