Discusión:Varianza

Esta página le interesa al Wikiproyecto Mejora de artículos esenciales.

Esta igualdad es falsa: $s_{n}^{2}={\frac {1}{n}}\sum _{i=1}^{n}\left(X_{i}-{\overline {X}}\right)^{2}=\left({\frac {1}{n}}\sum _{i=1}^{n}X_{i}^{2}\right)-{\overline {X}}^{2}$

el cuadrado no se puede distribuir en el paréntesis y así separarlo de la sumatoria. La fórmula de la varianza es la sumatoria de los cuadrados de los desvíos dividido N (o N-1 si se trata de una muestra). El último miembro expresa la suma de todos los valores de X al cuadrado dividido N, y a ese resultado se le resta la media al cuadrado. --Gustavo Cavagnaro (discusión) 01:08 25 nov 2014 (UTC)[responder]

Esta página está muy liosa, estaría mucho mejor que estuviese tan currada como la versión en inglés. lo de n-1 es para estimar la varianza de una muestra.

Una aclaración sobre si es dividido por n o n-1. Si lo que hacemos es obtener la varianza de TODA una población, nuestro resultado es exactamente la varianza, y por tanto debe ir dividida por n. Sin embargo, como dice el comentario anterior, en caso de que sólo tomemos una MUESTRA PARCIAL sobre una población total, nuestro cálculo da sólo una estimación de la varianza. En ese caso, el denominador debe ser n-1.Sí conseguimos lo que en matemáticas se llama un "operador fiel", es decir, uno cuyo valor medio da exactamente la varianza.

Estaría bien que alguien pusiera por qué la varianza muestral es un promedio de diferencias al cuadrado, es decir, que explicara por qué al cuadrado.

En primer lugar, se debería diferenciar la varianza muestral y la varianza poblacional de la varianza para una variable aleatoria:

Varianza muestral ( $s^{2}$ )[editar]

Definición[editar]

Medida de la dispersión de los valores respecto a la media muestral, es decir, respecto a un subconjunto de la población. Se representa mediante $s^{2}$ . Otra medida de dispersión estrechamente unida a la varianza muestral es la desviación típica muestral, que corresponde con la raíz cuadrada no negativa de la varianza muestral:

                            $\operatorname {s} ={\sqrt {s^{2}}}$

Es correcto el cálculo de la varianza muestral:

                            $\operatorname {var} ={{\frac {1}{n-1}}\sum _{i=1}^{N}(x_{i}-{\overline {x}})^{2}}$

, donde el denominador es (n-1), no N como sería lo lógico, para compensar errores en el cálculo de la varianza. Analizando las dos fórmulas anteriores, se puede deducir lo siguiente: como la desviación típica no es negativa, tampoco lo será la varianza muestral $s^{2}$ . También, $s^{2}$ será cero sólamente cuando el valor de cada dato $x_{i}$ sea igual a ${\overline {x}}$ . Por tanto, cuanta más distancia haya entre los valores de los datos, mayor será la varianza muestra y con ella, la desviación típica.

Ejemplo[editar]

(el ejemplo del cálculo de la varianza en un conjunto finito de datos es válido, aunque se debería especificar si ese conjunto de datos es todo el espacio o es una muestra aleatoria de una población. Si es el primer caso, de debería aplicar la definición de varianza poblacional,ya que se estudia todo el espacio probabilístico. Si es el segundo, entonces sería válido el cálculo realizado)

Varianza poblacional ( $\sigma ^{2}$ )[editar]

Definición[editar]

Medida de la dispersión de los valores respecto a la media poblacional. Se representa mediante $\sigma ^{2}$

                              $\operatorname {\sigma ^{2}} ={\frac {1}{n}}\sum _{i=1}^{n}\left(x_{i}-\mu \right)^{2}\,\!$

, donde μ representa la media poblacional (corregido de la fórmula inicial del documento, ya que ${\overline {x}}$ representa la media muestral, no poblacional)

Ejemplo[editar]

El ejemplo podría ser el mismo que en el caso de varianza muestral, sólo que se consideraría el conjunto de datos como toda la población, es decir, N sería el tamaño de la población y la fórmula que se debería aplicar sería la correspondiente a la varianza poblacional.

Varianza de una variable aleatoria ( $\operatorname {Var} (X)$ )[editar]

Como bien diferencia el artículo en inglés de la varianza (variance), una variable aleatoria puede ser contínua o discreta, según los valores posibles que puede tomar (en el caso de ser discreta, los valores deben ser numerables; en el caso de ser contínua tomaría infinitos valores no numerables).

Definición[editar]

La varianza de una variable aleatoria mide el promedio teórico de las desviaciones al cuadrado de los posibles valores de la variable aleatoria respecto a su centro de gravedad. Dada una variable aleatoria X

                         $\operatorname {Var(X)} =\operatorname {E} [(X-\mu )^{2}]=\operatorname {E} [X-\operatorname {E(X)} ]^{2}=\sigma _{x}^{2}$

Al igual que en la varianza muestral, la varianza de una variable aleatoria es un número positivo. De igual forma, la raíz cuadrada positiva de este número se le denomina desviación estándar, cuya expresión es la que sigue:

                        $\operatorname {\sigma _{x}} ={\sqrt {\operatorname {Var} (X)}}={\sqrt {\operatorname {E} [(X-\mu )^{2}]}}$

Propiedades[editar]

Las principales propiedades de la varianza de una variable aleatoria son las siquientes:

1. $\operatorname {Var(X)} >=0$

2. $\operatorname {Var(X)} =0$ sii P(X=c)=1, siendo c una constante. Por tanto, $\operatorname {Var(c)} =0$

3. $\operatorname {Var(cX)} =E(cX-E(cX)]^{2}=E[cX-cE(X)]^{2}=c^{2}Var(X)$

4. Si definimos una variable aleatoria estandarizada, relacionada con la variable aleatoria X con media $\mu$ y desviación estándar $\sigma (\sigma >0)$ , entonces tendremos: $\operatorname {X^{*}} ={\frac {X-\mu }{\sigma }}$ , cuya característica principal es $E(X^{*})=0$ y $Var(X^{*})=1$

En la edición inglesa de este artículo viene una descripción más detallada de las propiedades de la varianza. Aquí se han expuesto las más básicas.

Casos según la variable aleatoria[editar]

A continuación analizaremos los dos casos de variable aleatoria:

Caso contínuo[editar]

En el caso en que la variable aleatoria X sea contínua, con una función de densidad f(x), la expresión para calcular la varianza es la siguiente:

                        $\operatorname {\sigma _{x}^{2}} =\operatorname {Var} (X)=\operatorname {E} [(X-\mu )^{2}]=\int _{-\infty }^{\infty }(x-\mu )^{2}f(x)dx$

, cuya condición es que la integral converja.

Caso discreto[editar]

Dada una variable aleatoria X cuyos valores son $x_{1}$ , $x_{2}$ ,... , $x_{n}$ y su función de probabilidad es f(x), su varianza por tanto, está definida como:

                         $\operatorname {\sigma _{x}^{2}} =\operatorname {E} [(X-\mu )^{2}]=\sum _{i=1}^{n}(x_{i}-\mu )^{2}f(x_{i})=\sum (x-\mu )^{2}f(x)$

Para facilitar las operaciones, se puede utilizar una útil relación entre varianza y esperanza de una variable aleatoria:

                         $\operatorname {Var(X)} =E(X^{2})-E^{2}(X)$

--Pr2estadistica (discusión) 02:55 15 mar 2009 (UTC)[responder]

Varianza muestral ( s 2 {\displaystyle s^{2}} )[editar]

Definición[editar]

Ejemplo[editar]

Varianza poblacional ( σ 2 {\displaystyle \sigma ^{2}} )[editar]

Definición[editar]

Ejemplo[editar]

Varianza de una variable aleatoria ( Var ⁡ ( X ) {\displaystyle \operatorname {Var} (X)} )[editar]

Definición[editar]

Propiedades[editar]

Casos según la variable aleatoria[editar]

Caso contínuo[editar]

Caso discreto[editar]

Varianza muestral ( $s^{2}$ )[editar]

Varianza poblacional ( $\sigma ^{2}$ )[editar]

Varianza de una variable aleatoria ( $\operatorname {Var} (X)$ )[editar]