Diferencia entre revisiones de «Intervalo de confianza»

De Wikipedia, la enciclopedia libre
Contenido eliminado Contenido añadido
Richy (discusión · contribs.)
m Revertidos los cambios de 190.56.96.137 a la última edición de TXiKiBoT
Línea 12: Línea 12:
De una [[población estadística|población]] de [[media aritmética|media]] <math>\mu</math> y [[desviación típica]] <math>\sigma</math> se pueden tomar [[muestreo estadístico|muestras]] de <math>n</math> elementos. Cada una de estas muestras tiene a su vez una media (<math>\bar{x}</math>). Se puede demostrar que la media de todas las medias muestrales coincide con la media poblacional:<ref>Es una consecuencia del [[Teorema Central del Límite]].</ref> <math>\mu_{\bar{x}} = \mu</math>
De una [[población estadística|población]] de [[media aritmética|media]] <math>\mu</math> y [[desviación típica]] <math>\sigma</math> se pueden tomar [[muestreo estadístico|muestras]] de <math>n</math> elementos. Cada una de estas muestras tiene a su vez una media (<math>\bar{x}</math>). Se puede demostrar que la media de todas las medias muestrales coincide con la media poblacional:<ref>Es una consecuencia del [[Teorema Central del Límite]].</ref> <math>\mu_{\bar{x}} = \mu</math>


Pero además, si el tamaño de las muestras es lo suficientemente grande,<ref>En la práctica se considera normal la distribución si n > 30.</ref> la distribución de medias muestrales es, prácticamente, una [[distribución normal]] (o gaussiana) con media μ y una desviación típica dada por la siguiente expresión: <math>\sigma_{\bar{x}} = \frac{\sigma}{\sqrt{n}}</math>. Esto se representa como sigue: <math>\bar{X} \sim N(\mu, \frac{\sigma}{\sqrt{n}})</math>. Si [[estandarizar|estandarizamos]], se sigue que: <<nowiki><nowiki>Introduce aquí texto sin formato</nowiki><nowiki><math>Introduce aquí texto sin formato</math>[[Archivo:
Pero además, si el tamaño de las muestras es lo suficientemente grande,<ref>En la práctica se considera normal la distribución si n > 30.</ref> la distribución de medias muestrales es, prácticamente, una [[distribución normal]] (o gaussiana) con media μ y una desviación típica dada por la siguiente expresión: <math>\sigma_{\bar{x}} = \frac{\sigma}{\sqrt{n}}</math>. Esto se representa como sigue: <math>\bar{X} \sim N(\mu, \frac{\sigma}{\sqrt{n}})</math>. Si [[estandarizar|estandarizamos]], se sigue que: <math>\frac{\bar{X} - \mu}{\frac{\sigma}{\sqrt{n}}}=Z \sim N(0, 1)</math>
== Ejemplo.jpg ==
[
----
http://www.ejemplo.com Título del enlace
----

----

----
]]]</nowiki></nowiki>igma}{\sqrt{n}}}=Z \sim N(0, 1)</math>


En una distribución ''Z'' ~ ''N''(0, 1) puede calcularse fácilmente un intervalo dentro del cual "caigan" un determinado porcentaje de las observaciones, esto es, es sencillo hallar ''z''<sub>1</sub> y ''z''<sub>2</sub> tales que P[''z''<sub>1</sub> &le; z &le; ''z''<sub>2</sub>] = 1 - α, donde (1 - α)·100 es el porcentaje deseado (''véase el [[b:Tablas estadísticas/Distribución normal|uso de las tablas en una distribución normal]]'').
En una distribución ''Z'' ~ ''N''(0, 1) puede calcularse fácilmente un intervalo dentro del cual "caigan" un determinado porcentaje de las observaciones, esto es, es sencillo hallar ''z''<sub>1</sub> y ''z''<sub>2</sub> tales que P[''z''<sub>1</sub> &le; z &le; ''z''<sub>2</sub>] = 1 - α, donde (1 - α)·100 es el porcentaje deseado (''véase el [[b:Tablas estadísticas/Distribución normal|uso de las tablas en una distribución normal]]'').

Revisión del 17:40 16 mar 2010

Las líneas verticales representan 50 construcciones diferentes de intervalos de confianza para la estimación del valor μ

Se llama intervalo de confianza en estadística a un par de números entre los cuales se estima que estará cierto valor desconocido con una determinada probabilidad de acierto. Formalmente, estos números determinan un intervalo, que se calcula a partir de datos de una muestra, y el valor desconocido es un parámetro poblacional. La probabilidad de éxito en la estimación se representa por 1 - α y se denomina nivel de confianza. En estas circunstancias, α es el llamado error aleatorio o nivel de significación, esto es, una medida de las posibilidades de fallar en la estimación mediante tal intervalo.[1]

El nivel de confianza y la amplitud del intervalo varían conjuntamente, de forma que un intervalo más amplio tendrá más posibilidades de acierto (mayor nivel de confianza), mientras que para un intervalo más pequeño, que ofrece una estimación más precisa, aumentan sus posibilidades de error.

Para la construcción de un determinado intervalo de confianza es necesario conocer la distribución teórica que sigue el parámetro a estimar, θ. Es habitual que el parámetro se distribuya normalmente. También pueden construirse intervalos de confianza con la desigualdad de Chebyshov.

En definitiva, un intervalo de confianza al 1 - α % para la estimación de un parámetro poblacional θ que sigue una determinada distribución de probabilidad, es una expresión del tipo [θ1, θ2] tal que P[θ1 ≤ θ ≤ θ2] = 1 - α, donde P es la función de distribución de probabilidad de θ.

Ejemplos

Intervalo de confianza para la media de una población

De una población de media y desviación típica se pueden tomar muestras de elementos. Cada una de estas muestras tiene a su vez una media (). Se puede demostrar que la media de todas las medias muestrales coincide con la media poblacional:[2]

Pero además, si el tamaño de las muestras es lo suficientemente grande,[3]​ la distribución de medias muestrales es, prácticamente, una distribución normal (o gaussiana) con media μ y una desviación típica dada por la siguiente expresión: . Esto se representa como sigue: . Si estandarizamos, se sigue que:

En una distribución Z ~ N(0, 1) puede calcularse fácilmente un intervalo dentro del cual "caigan" un determinado porcentaje de las observaciones, esto es, es sencillo hallar z1 y z2 tales que P[z1 ≤ z ≤ z2] = 1 - α, donde (1 - α)·100 es el porcentaje deseado (véase el uso de las tablas en una distribución normal).

Se desea obtener una expresión tal que

En esta distribución normal de medias se puede calcular el intervalo de confianza donde se encontrará la media poblacional si sólo se conoce una media muestral (), con una confianza determinada. Habitualmente se manejan valores de confianza del 95% y 99%. A este valor se le llamará (debido a que es el error que se cometerá, un término opuesto).

Para ello se necesita calcular el punto —o mejor dicho su versión estandarizada — junto con su "opuesto en la distribución" . Estos puntos delimitan la probabilidad para el intervalo, como se muestra en la siguiente imagen:

Dicho punto es el número tal que:

Y en la versión estandarizada se cumple que:

Así:

Haciendo operaciones es posible despejar para obtener el intervalo:

Resultando el intervalo de confianza:

Si no es conocida y n es grande (habitualmente se toma n ≥ 30):[4]

, donde s es la desviación típica de una muestra.

Aproximaciones para el valor para los niveles de confianza estándar son 1,96 para y 2,576 para .[5]

Intervalo de confianza para una proporción

El intervalo de confianza para estimar una proporción p, conocida una proporción muestral pn de una muestra de tamaño n, a un nivel de confianza del (1-α)·100% es:

En la demostración de estas fórmulas están involucrados el Teorema Central del Límite y la aproximación de una binomial por una normal.[6]​ </ref>

Véase también


Referencias

  1. Rius Díaz, Francisca (octubre de 1997). «8.2. Estimación confidencial». Bioestadística. Métodos y aplicaciones. Málaga: Universidad de Málaga. ISBN 84-7496-653-1. Consultado el 07-04-2009. 
  2. Es una consecuencia del Teorema Central del Límite.
  3. En la práctica se considera normal la distribución si n > 30.
  4. Sotomayor Velasco, Gabriel; Wisniewski, Piotr Marian (2001). «10.2. Intervalos de confianza para medias». Probabilidad y estadística para ingeniería y ciencias. Cengage Learning Editores. p. 230. ISBN 970686136X. Consultado el 20 de abril de 2009. 
  5. Véanse en las tablas de la normal tipificada las entradas correspondientes a los valores 0,95 y 0,99
  6. Rius Díaz, Francisca (octubre de 1997). «8.6.2. Intervalo para una proporción». Bioestadística. Métodos y aplicaciones. Málaga: Universidad de Málaga. ISBN 84-7496-653-1. Consultado el 24 de abril de 2009. 
  • Fisher, R.A. (1956) Statistical Methods and Scientific Inference. Oliver and Boyd, Edinburgh. (See p. 32.)
  • Freund, J.E. (1962) Mathematical Statistics Prentice Hall, Englewood Cliffs, NJ. (See pp. 227-228.)
  • Hacking, I. (1965) Logic of Statistical Inference. Cambridge University Press, Cambridge
  • Keeping, E.S. (1962) Introduction to Statistical Inference. D. Van Nostrand, Princeton, NJ.
  • Kiefer, J. (1977) Journal of the American Statistical Association, 72, 789-827.
  • Neyman, J. (1937) Philosophical Transactions of the Royal Society of London A, 236, 333-380. (Seminal work.)
  • Robinson, G.K. (1975) Biometrika, 62, 151-161.
  • Zar, J.H. (1984) Biostatistical Analysis. Prentice Hall International, New Jersey. pp 43-45