Error absoluto medio

Para la dispersión en un conjunto de una sola variable, véase diferencia absoluta media y desviación media.

En estadística, el error absoluto medio es una medida de la diferencia entre dos variables continuas. Considerando dos series de datos (unos calculados y otros observados) relativos a un mismo fenómeno, el error absoluto medio sirve para cuantificar la precisión de una técnica de predicción comparando por ejemplo los valores predichos frente a los observados, el tiempo real frente al tiempo previsto, o una técnica de medición frente a otra técnica alternativa de medición.

Consideraciones generales

Dadas dos series de datos (X e Y) relativas a un mismo fenómeno, considérese un diagrama de dispersión de n puntos, donde el punto i tiene coordenadas (x_i, y_i). El error absoluto medio (EAM) es la distancia vertical promedio entre cada uno de los puntos y la recta identidad (y=x), o también la distancia horizontal promedio entre cada punto y la recta identidad.

Viene dado por:^[1]

\mathrm {EAM} ={\frac {\sum _{i=1}^{n}\left|y_{i}-x_{i}\right|}{n}}={\frac {\sum _{i=1}^{n}\left|e_{i}\right|}{n}}.

Este indicador tiene una interpretación clara como la diferencia absoluta promedio entre y_i y x_i. Es un dato habitualmente utilizado por su sencillez conceptual, pero con frecuencia se confunde con la raíz del error cuadrático medio, diferente del error absoluto promedio.^[1]^[2]

Como su nombre indica, el error absoluto medio es un promedio de los errores absolutos $|e_{i}|=|y_{i}-x_{i}|$ , donde $y_{i}$ es la predicción y $x_{i}$ el valor verdadero. Téngase en cuenta que las formulaciones alternativas pueden incluir frecuencias relativas como factores de ponderación. El error absoluto medio utiliza la misma escala que los datos que se están midiendo. Esto se conoce como una medida de precisión dependiente de la escala y, por lo tanto, no se puede usar para hacer comparaciones entre series que usan diferentes escalas.^[3] El error absoluto promedio es una medida común del error de predicción en series temporales,^[4] aunque a veces se confunde con la definición más estándar de desviación media.

Desajuste de cantidad y desajuste de asignación

Es posible expresar el error absoluto medio como la suma de dos componentes: desajuste de cantidad y desajuste de asignación. El desajuste de cantidad es el valor absoluto del error medio, dado por:^[5]

\mathrm {EM} ={\frac {\sum _{i=1}^{n}y_{i}-x_{i}}{n}}

El desajuste de asignación es el EMA menos el desajuste de cantidad.

También es posible identificar los tipos de diferencia observando un gráfico $(x,y)$ . La diferencia de cantidad existe cuando el promedio de los valores de X no es igual al promedio de los valores de Y. La diferencia de asignación existe si y solo si los puntos se sitúan a ambos lados de la recta identidad.^[5]^[2]

Medidas relacionadas

El error absoluto medio es una de las distintas maneras de comparar los pronósticos con los resultados finales. Las alternativas bien establecidas son el error escalado absoluto medio (EEAM) y el error cuadrático medio. Todos ellos resumen el resultado de manera que no tienen en cuenta el sentido de la predicción (por exceso o por defecto). Una medida que considera este aspecto es la diferencia con signo media.

Cuando se debe ajustar un modelo de predicción utilizando una medida del ajuste obtenido (en el sentido en que el enfoque de los mínimos cuadrados está relacionado con el error cuadrático medio), el equivalente del error absoluto medio son las mínimas desviaciones absolutas.

El error absoluto medio no es idéntico al error cuadrático medio, aunque en ocasiones se confundan. El primero es conceptualmente más simple y más interpretable, y no requiere el uso de cuadrados o de raíces cuadradas, siendo simplemente la distancia vertical u horizontal absoluta promedio entre cada punto en un diagrama de dispersión y la línea Y = X. En otras palabras, es la diferencia absoluta promedio entre X e Y. Además, cada error contribuye en proporción a su valor absoluto, lo que no es cierto para las estimaciones cuadráticas.^[5]

Propiedad de optimalidad

El error absoluto medio de una variable real c con respecto a la variable aleatoria X es

E(\left|X-c\right|)\,

Siempre que la distribución de probabilidad de X sea tal que exista la expectativa anterior, entonces m es una mediana de X si y solo si m es un minimizador de la media absoluta del error con respecto a X.^[6] En particular, m es una muestra mediana si y solo si m minimiza la media aritmética de las desviaciones absolutas.

Más generalmente, una mediana se define como un mínimo de

E(|X-c|-|X|),

como se analizó en el artículo dedicado a la mediana.

Esta definición de la mediana basada en la optimización es útil en el análisis de datos estadísticos, por ejemplo, en la agregación de k-medianas.

Véase también

Referencias

↑ ^a ^b Willmott, Cort J.; Matsuura, Kenji (19 de diciembre de 2005). «Advantages of the mean absolute error (MAE) over the root mean square error (RMSE) in assessing average model performance». Climate Research 30: 79-82. doi:10.3354/cr030079.
↑ ^a ^b Willmott, C. J.; Matsuura, K. (January 2006). «On the use of dimensioned measures of error to evaluate the performance of spatial interpolators». International Journal of Geographical Information Science 20: 89-102. doi:10.1080/13658810500286976.
↑ «2.5 Evaluating forecast accuracy | OTexts». www.otexts.org. Consultado el 18 de mayo de 2016.
↑ Hyndman, R. and Koehler A. (2005). "Another look at measures of forecast accuracy" [1]
↑ ^a ^b ^c Pontius Jr., Robert Gilmore; Thontteh, Olufunmilayo; Chen, Hao (2008). «Components of information for multiple resolution comparison between maps that share a real variable». Environmental and Ecological Statistics 15: 111-142. doi:10.1007/s10651-007-0043-y.
↑ Stroock, Daniel (2011). Probability Theory. Cambridge University Press. pp. 43. ISBN 978-0-521-13250-3.

Datos: Q6803609

[:0-1] Willmott, Cort J.; Matsuura, Kenji (19 de diciembre de 2005). «Advantages of the mean absolute error (MAE) over the root mean square error (RMSE) in assessing average model performance». Climate Research 30: 79-82. doi:10.3354/cr030079.

[:2-2] Willmott, C. J.; Matsuura, K. (January 2006). «On the use of dimensioned measures of error to evaluate the performance of spatial interpolators». International Journal of Geographical Information Science 20: 89-102. doi:10.1080/13658810500286976.

[3] «2.5 Evaluating forecast accuracy | OTexts». www.otexts.org. Consultado el 18 de mayo de 2016.

[Hyndman2005-4] Hyndman, R. and Koehler A. (2005). "Another look at measures of forecast accuracy" [1]

[:1-5] Pontius Jr., Robert Gilmore; Thontteh, Olufunmilayo; Chen, Hao (2008). «Components of information for multiple resolution comparison between maps that share a real variable». Environmental and Ecological Statistics 15: 111-142. doi:10.1007/s10651-007-0043-y.

[6] Stroock, Daniel (2011). Probability Theory. Cambridge University Press. pp. 43. ISBN 978-0-521-13250-3.

[1]

[2]

[3]

[4]

[5]

[6]