![](//upload.wikimedia.org/wikipedia/commons/thumb/1/1f/Commons-emblem-question_book_orange.svg/40px-Commons-emblem-question_book_orange.svg.png) |
Este aviso fue puesto el 10 de junio de 2020. |
En estadística, el lema fundamental de Neyman-Pearson es un resultado que describe el criterio óptimo para distinguir dos hipótesis simples
y
.
El lema debe su nombre a sus dos creadores, Jerzy Neyman y Egon Pearson.
Proposición[editar]
Sea
una muestra aleatoria de una población con función de densidad
donde
y sean
,
y
tales que
![{\displaystyle \operatorname {P} [\mathbf {X} \in {\mathcal {C}}|H_{0}]=\alpha }](https://wikimedia.org/api/rest_v1/media/math/render/svg/4798ff537746a28c0203ee636022e7f364d50bdb)
si
.
si
.
entonces la prueba asociada a
es una prueba más potente para probar
contra
, es decir,
es la mejor región crítica.
Sea
una muestra aleatoria de una población con distribución
donde
es conocida. Considere
![{\displaystyle {\begin{aligned}H_{0}&:\mu =\mu _{0}\\H_{1}&:\mu =\mu _{1}\\\alpha \end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/22b88f3434386bdaf85acb7f8f5f2401e078942f)
siendo
.
En esta caso la función de verosimilitud es
![{\displaystyle {\begin{aligned}{\mathcal {L}}(x_{1},\dots ,x_{n};\mu ,\sigma _{0}^{2})&=\prod _{i=1}^{n}{\frac {1}{\sqrt {2\pi \sigma _{0}^{2}}}}\exp \left(-{\frac {(x_{i}-\mu )^{2}}{2\sigma _{0}^{2}}}\right)\\&=\left({\frac {1}{\sqrt {2\pi \sigma _{0}^{2}}}}\right)^{n}\exp \left(-{\frac {1}{2\sigma _{0}^{2}}}\sum _{i=1}^{n}(x_{i}-\mu )^{2}\right)\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/487c7f69f332584a772b2948577d43ae6af0ef7c)
por el lema de Neyman-Pearson
![{\displaystyle {\begin{aligned}{\frac {{\mathcal {L}}_{0}}{{\mathcal {L}}_{1}}}&={\frac {\left({\frac {1}{\sqrt {2\pi \sigma _{0}^{2}}}}\right)^{n}\exp \left(-{\frac {1}{2\sigma _{0}^{2}}}\sum _{i=1}^{n}(x_{i}-\mu _{0})^{2}\right)}{\left({\frac {1}{\sqrt {2\pi \sigma _{0}^{2}}}}\right)^{n}\exp \left(-{\frac {1}{2\sigma _{0}^{2}}}\sum _{i=1}^{n}(x_{i}-\mu _{1})^{2}\right)}}\\&=\exp \left(-{\frac {1}{2\sigma _{0}^{2}}}\sum _{i=1}^{n}(x_{i}-\mu _{0})^{2}+{\frac {1}{2\sigma _{0}^{2}}}\sum _{i=1}^{n}(x_{i}-\mu _{1})^{2}\right)\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/14e1b82dc857c536d188db3b8abc1ff7abbbdc18)
pero
![{\displaystyle {\begin{aligned}\sum _{i=1}^{n}(x_{i}-\mu )^{2}&=\sum _{i=1}^{n}(x_{i}^{2}-2\mu x_{i}+\mu ^{2})\\&=\sum _{i=1}^{n}x_{i}^{2}-2\mu \sum _{i=1}^{n}x_{i}+n\mu ^{2}\\&=\sum _{i=1}^{n}x_{i}^{2}-2\mu n{\bar {x}}+n\mu ^{2}\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7b07a75cf25383e2aa5599e406e670727c9de2a1)
por lo que
![{\displaystyle {\begin{aligned}{\frac {{\mathcal {L}}_{0}}{{\mathcal {L}}_{1}}}&=\exp \left[-{\frac {1}{2\sigma _{0}^{2}}}\left(\sum _{i=1}^{n}x_{i}^{2}-2\mu _{0}n{\bar {x}}+n\mu _{0}^{2}-\sum _{i=1}^{n}x_{i}^{2}+2\mu _{1}n{\bar {x}}-n\mu _{1}^{2}\right)\right]\\&=\exp \left[-{\frac {1}{2\sigma _{0}^{2}}}\left(2n{\bar {x}}(\mu _{1}-\mu _{0})+n(\mu _{0}^{2}-\mu _{1}^{2})\right)\right]\\&=\exp \left[{\frac {n{\bar {x}}(\mu _{0}-\mu _{1})}{\sigma _{0}^{2}}}-{\frac {n(\mu _{0}^{2}-\mu _{1}^{2})}{2\sigma _{0}^{2}}}\right]\leq k_{1}\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1b43b8d3e57306b01cd1c479114ef3fb8a0f0e09)
lo anterior implica
![{\displaystyle {\begin{aligned}&{\frac {n{\bar {x}}(\mu _{0}-\mu _{1})}{\sigma _{0}^{2}}}-{\frac {n(\mu _{0}^{2}-\mu _{1}^{2})}{2\sigma _{0}^{2}}}\leq k_{2}=\ln(k_{1})\\&{\frac {n{\bar {x}}(\mu _{0}-\mu _{1})}{\sigma _{0}^{2}}}\leq k_{3}=k_{2}+{\frac {n(\mu _{0}^{2}-\mu _{1}^{2})}{2\sigma _{0}^{2}}}\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1ee678cf510cb0de734c550c68dd8104e70cc1c5)
como
entonces
luego
![{\displaystyle {\bar {x}}\geq k={\frac {k_{3}\sigma _{0}^{2}}{n(\mu _{0}-\mu _{1})}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/4e3b4533019dfb2e526de6f3fe600dfc5d4ae486)
por lo tanto se rechaza
si
, es decir la región de rechazo
queda descrita como
![{\displaystyle {\mathcal {C}}=\{(X_{1},X_{2},\dots ,X_{n}):{\bar {X}}\geq k\}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/eede1298ab14dccf13c704f0f619990b555f5980)
Aplicaciones en estadística secuencial[editar]
La versión secuencial de esta prueba fue desarrollada en el contexto de la Segunda Guerra Mundial por Wald. La idea subyacente consiste en contrastar las hipótesis nula y alternativa a medida que se recogen nuevos datos. Generalmente se busca llegar a una decisión (rechazar
o aceptarla) antes de contrastar toda la colección de datos. El procedimiento de decisión que se utiliza se explica a continuación:
Este procedimiento se conoce como prueba de la razón secuencial, y los valores
y
determinan los errores de tipo I y tipo II de este procedimiento. Recordemos que
tiene la forma siguiente:
De la definición del estadístico se sigue que
si se acepta la hipótesis nula, mientras que
en caso de aceptar la hipótesis alternativa.