Paradoja del falso positivo

De Wikipedia, la enciclopedia libre

La paradoja del falso positivo es un resultado estadístico donde las pruebas con falsos positivos son más probables que resultados con positivos verdaderos, esto se produce cuando la población en general tiene una baja incidencia de una condición y la tasa de incidencia es inferior a la tasa de falsos positivos. La probabilidad de un resultado positivo de la prueba se determina no solo por la precisión de la prueba, sino también por las características de la población muestreada.[1]​ Cuando la incidencia, la proporción de aquellos que tienen una condición dada, es más baja que la tasa de falso positivo de la prueba, incluso pruebas que tienen una muy baja probabilidad de dar un falso positivo en un caso individual, darán más falsos que verdaderos positivos en general.[2]​ La paradoja ha sorprendido a la mayoría de la gente.[3]

Esta paradoja es especialmente contraria a la intuición cuando se interpreta un resultado positivo en una prueba para una condición con baja incidencia en la población después de haber obtenido resultados positivos de una población con alta incidencia.[2]​ Si la tasa de falsos positivos de la prueba es mayor que la proporción de la nueva población con la condición, entonces un administrador de la prueba cuya experiencia se haya obtenido a partir de las pruebas en una población de alta incidencia puede concluir por experiencia que un resultado positivo generalmente indica verdadero positivo, cuando en realidad es mucho más probable que se haya producido un falso positivo.

No ajustarse a la escasez de la condición en la nueva población, y la conclusión de que un resultado positivo de la prueba indica probablemente un tema positivo, a pesar de que la incidencia de la población está por debajo de la tasa de falsos positivos es una "falacia de la frecuencia base".

Ejemplo[editar]

Población de alta incidencia[editar]

Número
de personas
Infectadas No infectadas Total
Prueba
positiva
400
(verdadero positivo)
30
(falso positivo)
430
Prueba
negativa
0
(falso negativo)
570
(verdadero negativo)
570
Total 400 600 1000

Imagínese que ejecuta una prueba de VIH en la población A de 1000 personas, de las cuales el 40% están infectados. La prueba tiene una tasa de falsos positivos del 5% (0,05) y no hay tasa de falsos negativos. El resultado que se espera de las pruebas en 1000 la población Una sería la siguiente:

Infectado y prueba indica la enfermedad ( verdaderos positivos )
1000 × 40/100 = 400 personas recibirían un verdadero positivo
la enfermedad no infectada y prueba indica (falso positivo)
1000 x 100 - 40/100 × 0,05 = 30 personas recibirían un falso positivo
Las pruebas restantes 570 están correctamente negativo.

Por lo tanto, en la población A, una persona que recibe un resultado positivo podría ser más del 93% de confianza (400/30 + 400) que indica correctamente la infección.

Población de baja incidencia[editar]

Número
de personas
Infectadas No infectadas Total
Prueba
positiva
20
(verdadero positivo)
49
(falso positivo)
69
Prueba
negativa
0
(falso negativo)
931
(verdadero negativo)
931
Total 20 980 1000

Ahora considere la misma prueba aplicada a la población B , en la que sólo el 2% está infectado. El resultado esperado de 1000 pruebas en la población B sería:

Infectado y prueba indica enfermedad ( verdadero positivo )
1000 × 2/100 = 20 personas recibirían un verdadero positivo
No infectado y prueba indica enfermedad (falso positivo)
1000 × 100 - 2/100 × 0,05 = 49 personas recibirían un falso positivo
Las 931 pruebas restantes son correctamente negativas.

En la población B, sólo 20 de las 69 personas totales con un resultado positivo de la prueba están realmente infectadas. Por lo tanto, la probabilidad de que realmente se infecte después de una se le dice que uno está infectado es sólo el 29% ( 20/20 + 49 ) para una prueba que de otra manera parece ser "95% de precisión".

Un examinador con experiencia del grupo A podría encontrar una paradoja que en el grupo B , un resultado que normalmente había indicado correctamente la infección ahora es generalmente un falso positivo . La confusión de la probabilidad posterior de infección con la probabilidad previa de recibir un falso positivo es un error natural después de recibir un resultado de prueba que pone en peligro la vida.

Véase también[editar]

Referencias[editar]

  1. Rheinfurth, M. H.; Howell, L. W. (March 1998). Probability and Statistics in Aerospace Engineering (pdf). NASA. p. 16. «MESSAGE: False positive tests are more probable than true positive tests when the overall population has a low incidence of the disease. This is called the false-positive paradox.» 
  2. a b Vacher, H. L. (May 2003). «Quantitative literacy - drug testing, cancer screening, and the identification of igneous rocks». Journal of Geoscience Education: 2. «At first glance, this seems perverse: the less the students as a whole use steroids, the more likely a student identified as a user will be a non-user. This has been called the False Positive Paradox».  - Citing: Smith, W. (1993). The cartoon guide to statistics. New York: Harper Collins. p. 49. 
  3. Madison, B. L. (August 2007). «Mathematical Proficiency for Citizenship». En Schoenfeld, A. H., ed. Assessing Mathematical Proficiency. Mathematical Sciences Research Institute Publications (New edición). Cambridge University Press. p. 122. ISBN 978-0-521-69766-8. «The correct [probability estimate...] is surprising to many; hence, the term paradox