Saturday 11 November 2017

Centrada En Movimiento Estadísticas Promedio


Cuando se calcula una media móvil, la colocación de la media en el periodo de tiempo medio que tiene sentido en el ejemplo anterior se calculó el promedio de los primeros períodos de tiempo 3 y lo colocó junto al periodo 3. Podríamos haber colocado el medio en el medio de la intervalo de tiempo de tres períodos, es decir, al lado de periodo 2. Esto funciona bien con períodos de tiempo impares, pero no tan bueno para períodos iguales de tiempo. Entonces, ¿dónde podríamos colocar la primera media móvil cuando M 4 Técnicamente, el promedio móvil caería en t 2.5, 3.5. Para evitar este problema que suavizar los MAs utilizando M 2. Así que suavizar los valores suavizados Si tenemos una media de un número par de términos, tenemos que suavizar los valores suavizados La siguiente tabla muestra los resultados utilizando M 4.David, Sí, es MapReduce destinado a funcionar en una gran cantidad de datos. Y la idea es que, en general, el mapa y reducir funciones shouldn39t importa cuántos mapeadores o cuántas reductores hay, that39s simplemente optimización. Si usted piensa cuidadosamente sobre el algoritmo que he publicado, se puede ver que doesn39t materia que mapeador obtiene qué partes de los datos. Cada registro de entrada estará disponible para todos los reducen operación que lo necesita. ndash Joe K Sep 18 de las 12 de la 22:30 En lo mejor de mi entendimiento media móvil no es muy bien los mapas de paradigma MapReduce ya que su cálculo se ventana sobre datos ordenados desliza en esencia, mientras que la RM es el procesamiento de los intervalos que no se intersectado de datos ordenados. Solución que veo es el siguiente: a) Aplicar particionador a medida para ser capaz de hacer dos particiones diferentes en dos carreras. En cada ejecutar sus reductores obtendrá diferentes rangos de datos y calcular la media móvil donde approprieate Voy a tratar de ilustrar: En los datos de la primera tanda de reductores debe ser: R1: Q1, Q2, Q3, Q4 R2: Q5, Q6, Q7, Q8 . aquí se cacluate media móvil para algunas Qs. En su próxima ejecución reductores deben obtener datos como: R1: Q1. Q6 R2: Q6. Q10 R3: Q10..Q14 Y caclulate el resto de las medias móviles. A continuación, tendrá que agregar los resultados. Idea de particionador personalizado que tendrá dos modos de funcionamiento - cada vez que se divide en intervalos iguales pero con algún cambio. En un pseudocódigo que se verá como esto. partición (keySHIFT) / (MAXKEY / numOfPartitions) donde: SHIFT será tomado de la configuración. MAXKEY valor máximo de la llave. Asumo para simplificar, que comienzan con cero. RecordReader, en mi humilde opinión no es una solución ya que se limita a la división específica y no puede deslizarse sobre escisiones límite. Otra solución sería implementar una lógica personalizada de los datos de entrada de división (que es parte de la InputFormat). Se puede hacer que hacer 2 toboganes diferentes, similar a la partición. contestada 17 de Sep 12 de la 8: 59moving media promedio de los datos de series de tiempo (observaciones igualmente espaciados en el tiempo) de varios períodos consecutivos. Llamado en movimiento, ya que se recalcula continuamente a medida que se disponga de nuevos datos, que avanza al dejar caer el primer valor y añadiendo el último valor. Por ejemplo, la media móvil de las ventas de seis meses puede ser calculado tomando el promedio de las ventas de enero a junio, entonces el promedio de las ventas de febrero a julio, luego del mes de marzo a agosto, y así sucesivamente. Media móvil (1) reducir el efecto de las variaciones temporales en los datos, (2) mejorar el ajuste de los datos a una línea (un proceso llamado de suavizado) para mostrar la tendencia Datas más claramente, y (3) resaltar cualquier valor por encima o por debajo de la tendencia. Si está calculando algo con muy alta varianza lo mejor que puede ser capaz de hacer es averiguar la media móvil. Yo quería saber lo que era la media móvil de los datos, por lo que tendría una mejor comprensión de lo que estábamos haciendo. Cuando usted está tratando de averiguar algunos números que cambian a menudo lo mejor que puede hacer es calcular la media móvil. El mejor de BusinessDictionary, dailyMoving medias medias con conjuntos de datos móviles convencionales entregan el valor medio es a menudo la primera, y una de las estadísticas de resumen, más útiles para el cálculo. Cuando los datos se encuentra en la forma de una serie de tiempo, la serie media es una medida útil, pero no refleja la naturaleza dinámica de los datos. Los valores medios calculados durante períodos en cortocircuito, ya sea anterior al período actual o se centraron en el período actual, son a menudo más útil. Debido a que tales valores medios variarán, o mover, ya que los actuales período se mueve desde el tiempo t 2, t 3. etc que se conocen como las medias móviles (MAS). Una media móvil simple es (normalmente) el promedio no ponderado de los valores anteriores k. Un promedio móvil ponderado exponencialmente es esencialmente la misma que una media móvil simple, pero con contribuciones a la media ponderada por su proximidad a la hora actual. Debido a que no es uno, sino toda una serie de promedios para cualquier serie dada en movimiento, el conjunto de Mas puede ser trazada a sí mismos en los gráficos, analizada como una serie, y se utiliza en el modelado y predicción. Una gama de modelos se puede construir usando medias móviles, y estos son conocidos como modelos MA. Si estos modelos se combinan con autorregresivo (AR) modelos de los modelos compuestos resultantes se conocen como modelos ARMA o ARIMA (el I es para integrado). promedios móviles simple, ya una serie de tiempo se pueden considerar como un conjunto de valores,, t 1,2,3,4, n el promedio de estos valores se pueden calcular. Si se supone que n es bastante grande, y seleccionar un entero k que es mucho menor que n. podemos calcular un conjunto de medias de bloques, o promedios móviles simples (de orden k): Cada medida representa la media de los valores de datos durante un intervalo de k observaciones. Tenga en cuenta que el primer MA posible de orden k Gt0 es que para t k. De manera más general, podemos dejar el subíndice adicional en las expresiones anteriores y escribir: Esto indica que la media estimada en el momento t es el promedio simple del valor observado en el tiempo t y los pasos k -1 de tiempo anteriores. Si se aplican pesos que disminuye la contribución de las observaciones que están más lejos en el tiempo, se dice que está suavizado exponencial de la media móvil. Las medias móviles se utilizan a menudo como una forma de previsión, por lo que el valor estimado para una serie en el tiempo t 1, S t1. se toma como el MA para el período hasta e incluyendo el tiempo t. p. ej. del día de hoy estimación se basa en un promedio de los valores registrados anteriores hasta e incluyendo el de ayer (para datos diarios). medias móviles simples pueden ser vistos como una forma de suavizado. En el ejemplo que se ilustra a continuación, el conjunto de datos de la contaminación del aire se muestra en la introducción de este tema ha sido aumentada por una línea de 7 días de media móvil (MA), se muestra en rojo. Como puede verse, la línea MA suaviza los picos y valles en los datos y puede ser muy útil en la identificación de tendencias. La fórmula de cálculo estándar hacia adelante significa que los primeros puntos k -1 de datos no tienen valor MA, pero a partir de entonces los cálculos se extienden hasta el punto final de datos en la serie. PM10 valores medios diarios, Greenwich fuente: Red de Calidad del Aire de Londres, www. londonair. org. uk Una de las razones para el cálculo de promedios móviles simples de la manera descrita es que permite a los valores que se computará para todos los intervalos de tiempo de vez tk hasta el presente y, como se obtiene una nueva medición para el tiempo t 1, el MA para el tiempo t 1 puede añadirse al conjunto ya calculado. Esto proporciona un procedimiento sencillo para los conjuntos de datos dinámicos. Sin embargo, hay algunos problemas con este enfoque. Es razonable afirmar que el valor medio durante los 3 últimos períodos, por ejemplo, se debe colocar en el tiempo t-1, no el tiempo t. y para un MA más de un número par de períodos quizás debería estar situado en el punto medio entre dos intervalos de tiempo. Una solución a este problema es utilizar cálculos MA centrado, en el que el agente de administración en el tiempo t es la media de un conjunto de valores simétrica alrededor de t. A pesar de sus méritos evidentes, este enfoque no se utiliza por lo general, ya que requiere que los datos estén disponibles para los eventos futuros que pueden no ser el caso. En casos en los que el análisis es totalmente de una serie existente, el uso de Mas centrado puede ser preferible. medias móviles simples pueden ser considerados como una forma de suavización, eliminación de algunos componentes de alta frecuencia de una serie temporal y poner de relieve (pero no eliminar) las tendencias de una manera similar a la noción general de filtrado digital. De hecho, las medias móviles son una forma de filtro lineal. Es posible aplicar un cálculo de media móvil a una serie que ya ha sido alisado, es decir, suavizado o filtrado de una serie ya alisada. Por ejemplo, con un promedio móvil de orden 2, podemos considerarlo como se calcula utilizando pesos, por lo que el MA en 2 x 0,5 x 0,5 x 1 2. Del mismo modo, el MA en 3 x 0,5 x 0,5 x 2 3. Si nos aplicar un segundo nivel de suavizado o filtrado, tenemos 0,5 x 2 0,5 x 3 0,5 (0,5 x 1 0,5 x 2) 0,5 (0,5 x 2 0,5 x 3) 0,25 x 1 0,5 x 2 0,25 x 3 es decir, el filtrado de 2 etapas proceso (o la convolución) ha producido una simétrica variable ponderada media móvil, con los pesos. Múltiples circunvoluciones pueden producir promedios móviles ponderados bastante complejas, algunas de las cuales han sido encontrados de uso particular en campos especializados, como en los cálculos de seguros de vida. Las medias móviles se pueden utilizar para eliminar los efectos periódicas si computado con la longitud de la periodicidad como conocida. Por ejemplo, con variaciones estacionales de datos mensual a menudo se pueden quitar (si este es el objetivo) por aplicar una simétrica media móvil de 12 meses con todos los meses ponderadas por igual, excepto la primera y la última que se pondera por medio. Esto es debido a que habrá 13 meses en el modelo simétrico (hora actual, t / -. 6 meses). El total se divide por 12. Los procedimientos similares pueden ser adoptados por cualquier periodicidad bien definido. promedios móviles ponderados exponencialmente (EWMA) con la simple fórmula de media móvil: todas las observaciones se ponderan por igual. Si llamamos a estos pesos iguales, alfa t. cada uno de los pesos k sería igual a 1 / k. por lo que la suma de los pesos sería 1, y la fórmula será: Ya hemos visto que múltiples aplicaciones de este resultado del proceso en los pesos variables. Con promedios móviles ponderados exponencialmente se deliberó reduce la contribución al valor medio de las observaciones que están más alejados en el tiempo, poniendo así de relieve los acontecimientos más recientes (locales). Esencialmente un parámetro de suavizado, 0LT LT1 alfa, se introduce, y la fórmula revisada para: Una versión simétrica de esta fórmula sería de la forma: Si se seleccionan los pesos en el modelo simétrico como los términos de los términos de la expansión binomial, (1/21/2) 2q. van a sumar a 1, y como q se hace grande, se aproximarán a la distribución normal. Esta es una forma de ponderación del núcleo, con la actuación Binomial como la función del núcleo. La convolución de dos etapas descrito en la subsección anterior es precisamente esta disposición, con q 1, dando los pesos. En suavizado exponencial es necesario utilizar un conjunto de pesos que suma a 1 y que reducen de tamaño geométricamente. Las ponderaciones utilizadas son típicamente de la forma: Para demostrar que estos pesos suman 1, consideran que la expansión de 1 / como una serie. Podemos escribir y desarrollar la expresión entre paréntesis, utilizando la fórmula del binomio (1- x) p. donde x (1-) y P -1, lo que da: Este continuación, proporciona una forma de media móvil ponderada de la forma: Esta suma puede escribirse como una relación de recurrencia: lo que simplifica en gran medida el cálculo, y evita el problema de que el régimen de ponderación debe ser estrictamente infinito por los pesos que su suma sea 1 (para valores pequeños de alfa. esto no suele ser el caso). La notación utilizada por diferentes autores varía. Algunos usan la letra S para indicar que la fórmula es esencialmente una variable alisado, y escribir: mientras que la literatura de la teoría de control a menudo utiliza Z en lugar de S para los valores exponencialmente ponderados o suavizadas (véase, por ejemplo, Lucas y Saccucci de 1990, LUC1 , y el sitio web del NIST para más detalles y ejemplos prácticos). Las fórmulas citadas anteriormente se derivan del trabajo de Roberts (1959, Rob1), pero Hunter (1986, HUN1) utiliza una expresión de la forma: que puede ser más apropiada para su uso en algunos procedimientos de control. Con alfa 1 la estimación media es simplemente su valor medido (o el valor del elemento de datos anterior). Con 0,5 la estimación es la media móvil simple de las mediciones actuales y anteriores. En previsión de los modelos de valor, S t. se utiliza a menudo como la estimación o el valor pronóstico para el próximo período de tiempo, es decir, como la estimación de x en el tiempo t 1. Por lo tanto tenemos: Esto muestra que el valor de previsión en el tiempo t 1 es una combinación de la media móvil exponencialmente ponderada anterior más un componente que representa el error de predicción ponderado, epsilon. en el tiempo t. Suponiendo una serie de tiempo que se da y se requiere un pronóstico, se requiere un valor de alfa. Esto puede estimarse a partir de los datos existentes mediante la evaluación de la suma de los errores de predicción al cuadrado obtener con diferentes valores de alfa para cada t 2,3. establecer la primera estimación que es el primer valor de datos observados, x 1. En aplicaciones de control el valor de alfa es importante en que se se utiliza en la determinación de los límites de control superior e inferior, y afecta a la longitud de ejecución promedio (ARL) que se espera antes de que estos límites de control se rompen (bajo el supuesto de que la serie de tiempo representa un conjunto de azar, idénticamente distribuidas variables independientes con varianza común). Bajo estas circunstancias, la varianza de la estadística de control: es (Lucas y Saccucci, 1990): Control de límites se fijan generalmente como múltiplos fijos de esta varianza asintótica, por ejemplo / - 3 veces la desviación estándar. Si alfa 0,25, por ejemplo, y los datos que están siendo monitorizados se supone que tiene una distribución normal, N (0,1), cuando en el control, los límites de control serán / - 1,134 y el proceso alcanzarán uno u otro límite en 500 pasos en promedio. Lucas y Saccucci (1990 LUC1) derivan las ARL para una amplia gama de valores alfa y bajo diversas hipótesis utilizando los procedimientos de la cadena de Markov. Se tabulan los resultados, incluyendo la provisión ARL cuando la media del proceso de control se ha cambiado por algún múltiplo de la desviación estándar. Por ejemplo, con un desplazamiento de 0,5 con alfa 0.25 el ARL es de menos de 50 pasos de tiempo. Los enfoques descritos anteriormente se conoce como suavizado exponencial simple. ya que los procedimientos se aplican una vez que la serie de tiempo y después análisis o los procesos de control se llevan a cabo en el conjunto de datos alisado resultante. Si el conjunto de datos incluye una tendencia y / o componentes estacionales, de dos o de tres etapas de suavizado exponencial puede ser aplicado como un medio de eliminar (explícitamente modelar) estos efectos (véase más adelante, la sección sobre predicción. Abajo, y el NIST ejemplo trabajó ). CHA1 Chatfield C (1975) El análisis de los tiempos de la serie: Teoría y Práctica. Chapman y Hall, Londres HUN1 Hunter J S (1986) El promedio móvil ponderado exponencialmente. J de Tecnología de Calidad, 18, 203-210 LUC1 Lucas J M, M Saccucci S (1990) ponderado exponencialmente en movimiento Esquemas de control Promedio: Propiedades y mejoras. Technometrics, 32 (1), 1-12 Rob1 Roberts S W (1959) Pruebas de control gráfico basado en medias móviles geométricas. Technometrics, 1, 239-250Spreadsheet aplicación del ajuste estacional y de suavizado exponencial Es sencillo para llevar a cabo el ajuste estacional y ajustar los modelos de suavizado exponencial usando Excel. Las imágenes de la pantalla y los gráficos siguientes se toman de una hoja de cálculo que se ha creado para ilustrar el ajuste estacional multiplicativo y suavizado exponencial lineal de los siguientes datos de ventas trimestrales de Outboard Marine: Para obtener una copia de la hoja de cálculo en sí, haga clic aquí. La versión de suavizado exponencial lineal que será utilizado aquí para los propósitos de demostración es la versión Brown8217s, simplemente debido a que puede ser implementado con una sola columna de fórmulas y sólo hay una constante de alisamiento para optimizar. Por lo general, es mejor utilizar la versión Holt8217s que tiene constantes de uniformización separados para nivel y la tendencia. El proceso de predicción se desarrolla de la siguiente manera: (i) en primer lugar los datos están ajustados estacionalmente (ii) a continuación, las previsiones se generan para los datos ajustados estacionalmente a través de suavizado exponencial lineal y (iii) finalmente las previsiones ajustadas por estacionalidad son quotreseasonalizedquot para obtener predicciones para la serie original . El proceso de ajuste de temporada se lleva a cabo en columnas D a través de G. El primer paso en el ajuste estacional es calcular un centrado de media móvil (realizado aquí en la columna D). Esto se puede hacer tomando el promedio de dos medias de un año de ancho que se compensan por un período de uno respecto al otro. (Una combinación de dos compensado promedios más que hace falta un único promedio para los propósitos de centrado cuando el número de estaciones es par.) El siguiente paso es calcular la relación de mover --i. e promedio. los datos originales dividido por el promedio móvil en cada período - que se realiza aquí en la columna E. (Esto también se llama el componente quottrend-cyclequot del patrón, en la medida de tendencia y ciclo económico efectos podrían ser considerados para ser todo lo queda después de un promedio sobre el conjunto de un año por valor de los datos. por supuesto, los cambios mes a mes en el que no se deben a la estacionalidad se pudo determinar por muchos otros factores, pero el promedio de 12 meses suaviza sobre ellos en gran medida.) la estimado índice de estacionalidad para cada estación se calcula con el promedio en primer lugar todos los coeficientes para esa estación en particular, que se realiza en las células G3-G6 usando una fórmula AVERAGEIF. Las proporciones medias se reajustarán a continuación, de modo que suman exactamente 100 veces el número de períodos en una temporada, o 400 en este caso, que se realiza en células H3-H6. A continuación, en la columna F, fórmulas BUSCARV se utilizan para insertar el valor del índice de temporada apropiada en cada fila de la tabla de datos, de acuerdo con el trimestre del año que representa. El CENTRADO media móvil y los datos ajustados estacionalmente terminar pareciéndose a esto: Tenga en cuenta que la media móvil normalmente se parece a una versión más suave de la serie ajustada estacionalmente, y es más corta en ambos extremos. Otra hoja de cálculo en el mismo archivo de Excel muestra la aplicación del modelo de suavizado exponencial lineal a los datos desestacionalizados, comenzando en la columna G. Un valor para la constante de alisamiento (alfa) se introduce por encima de la columna de previsión (en este caso, en la celda H9) y por conveniencia se le asigna el nombre de rango quotAlpha. quot (el nombre se asigna mediante el comando quotInsert / nombre / Createquot.) el modelo de LES se inicializa mediante el establecimiento de los dos primeros pronósticos igual al primer valor real de la serie ajustada estacionalmente. La fórmula usada aquí para la previsión del LES es la ecuación de una sola forma recursiva del modelo Brown8217s: Esta fórmula se introduce en la celda correspondiente al tercer período (en este caso, H15 celular) y se copia hacia abajo desde allí. Observe que el pronóstico LES para el período actual se refiere a las dos observaciones anteriores y los dos errores de predicción anteriores, así como el valor de alfa. Por lo tanto, la fórmula de predicción en la fila 15 se refiere únicamente a los datos que estaban disponibles en la fila 14 y anteriores. (Por supuesto, si deseamos utilizar simples en lugar de suavizado exponencial lineal, podríamos sustituir la fórmula SES aquí en su lugar. También podríamos utilizar Holt8217s en lugar de modelo Brown8217s LES, lo que requeriría dos columnas más de las fórmulas para calcular el nivel y la tendencia que se utilizan en el pronóstico.) los errores se calculan de la siguiente columna (en este caso, la columna J) restando los pronósticos de los valores reales. La raíz error cuadrado medio se calcula como la raíz cuadrada de la varianza de los errores más el cuadrado de la media. (Esto se deduce de la identidad matemática:. MSE VARIACIÓN (errores) (Promedio (errores)) 2) En el cálculo de la media y la varianza de los errores en esta fórmula, los dos primeros períodos se excluyen porque el modelo no comienza realmente la previsión hasta el tercer período (fila 15 en la hoja de cálculo). El valor óptimo de la alfa se puede encontrar ya sea cambiando manualmente alfa hasta que se encuentre el RMSE mínimo, o bien puede utilizar el quotSolverquot para realizar una minimización exacta. El valor de alfa que el solucionador encuentra se muestra aquí (alpha0.471). Por lo general, es una buena idea para trazar los errores del modelo (en unidades transformadas) y también para calcular y trazar sus autocorrelaciones en los retardos de hasta un año. Aquí es un gráfico de series temporales de los errores (desestacionalizados): Las autocorrelaciones de error se calculan utilizando la función COEF. DE. CORREL () para calcular las correlaciones de los errores con ellos mismos con un retraso de uno o más períodos - detalles se muestran en el modelo de hoja de cálculo . Aquí se presenta un gráfico de las autocorrelaciones de los errores en los primeros cinco rezagos: Las autocorrelaciones en los retardos del 1 al 3 son muy cercanos a cero, pero el aumento en el retardo 4 (cuyo valor es 0,35) es ligeramente molesto - que sugiere que la proceso de ajuste estacional no ha tenido un éxito completo. Sin embargo, en realidad es sólo marginalmente significativo. 95 bandas de significación para comprobar que es autocorrelaciones son significativamente diferentes de cero son aproximadamente más-o-menos 2 / SQRT (n-k), donde n es el tamaño de la muestra y K es el retraso. Aquí n es 38 y k varía de 1 a 5, por lo que la raíz cuadrada de n-k-menos-es de alrededor de 6 para todos ellos, y por lo tanto los límites para probar la significación estadística de las desviaciones de cero son más o menos plus - o-menos 2/6, o 0.33. Si varía el valor de alfa a mano en este modelo de Excel, se puede observar el efecto sobre la serie de tiempo y parcelas de autocorrelación de los errores, así como en el error de raíz media cuadrada, que se ilustra a continuación. En la parte inferior de la hoja de cálculo, la fórmula de predicción se quotbootstrappedquot en el futuro simplemente sustituyendo las previsiones para los valores actuales en el punto donde los datos reales se agota - es decir. donde quotthe futurequot comienza. (En otras palabras, en cada celda donde se produciría un valor de datos futuro, se inserta una referencia de celda que apunta a la previsión hecha para ese período.) Todas las otras fórmulas simplemente se copian desde arriba: Observe que los errores de las predicciones de el futuro están todos calcula a ser cero. Esto no significa que los errores reales serán cero, sino que simplemente refleja el hecho de que para efectos de predicción estamos suponiendo que los datos futuros serán iguales a las previsiones en promedio. Las previsiones LES resultantes para los datos ajustados estacionalmente este aspecto: Con este valor particular de alfa, que es óptima para las predicciones de un período hacia delante, la tendencia proyectada es ligeramente hacia arriba, lo que refleja la tendencia local que se observó durante los últimos 2 años más o menos. Para otros valores de alfa, se podría obtener una proyección tendencia muy diferente. Por lo general, es una buena idea para ver lo que ocurre con la proyección de tendencias a largo plazo cuando alfa es variada, ya que el valor que es mejor para la predicción a corto plazo no será necesariamente el mejor valor para predecir el futuro más lejano. Por ejemplo, aquí está el resultado que se obtiene si el valor de alfa se ajusta manualmente a 0,25: La tendencia proyectada a largo plazo es ahora más negativa que positiva con un valor menor de alfa, el modelo está poniendo más peso sobre los datos más antiguos en su estimación del nivel y la tendencia actual, y sus previsiones a largo plazo reflejan la tendencia a la baja observada en los últimos 5 años en lugar de la tendencia al alza más reciente. Este gráfico también ilustra claramente cómo el modelo con un valor menor de alfa es más lento para responder a quotturning pointsquot en los datos y por lo tanto tiende a hacer que un error del mismo signo durante muchos períodos consecutivos. Sus errores de pronóstico 1-paso-a continuación son más grandes que el promedio de los obtenidos antes (RMSE de 34,4 en lugar de 27,4) y fuertemente autocorrelated positivamente. El retraso de 1 autocorrelación de 0,56 supera con creces el valor de 0,33 calculado anteriormente para una desviación estadísticamente significativa de cero. Como alternativa al arranque por el valor de la alfa con el fin de introducir una mayor conservadurismo en previsiones a largo plazo, un factor quottrend dampeningquot a veces se añade al modelo con el fin de hacer que la tendencia proyectada a aplanar después de unos períodos. El último paso en la construcción del modelo de predicción es quotreasonalizequot las previsiones LES multiplicándolos por los índices estacionales apropiados. Por lo tanto, las previsiones reseasonalized en la columna I son simplemente el producto de los índices estacionales en la columna F y las previsiones LES desestacionalizados en la columna H. Es relativamente fácil de calcular los intervalos de confianza de las predicciones de un solo paso-a continuación realizadas por este modelo: en primer lugar calcular el RMSE (error de raíz media cuadrada, que es simplemente la raíz cuadrada del MSE) y luego calcular un intervalo de confianza para el pronóstico ajustados estacionalmente sumando y restando dos veces el RMSE. (En general un intervalo de confianza del 95 para obtener la previsión de un período hacia delante es más o menos igual a la previsión del punto más-o-menos-dos veces la desviación estándar estimada de los errores de predicción, suponiendo que la distribución de error es aproximadamente normal y el tamaño de la muestra es lo suficientemente grande, digamos, 20 o más. Aquí, el RMSE en lugar de la desviación estándar de la muestra de los errores es la mejor estimación de la desviación estándar de los futuros errores de pronóstico, ya que toma el sesgo, así variaciones aleatorias en cuenta.) los límites de confianza para el pronóstico ajustado estacionalmente se reseasonalized a continuación. junto con el pronóstico, multiplicándolos por los índices estacionales apropiados. En este caso, el RMSE es igual a 27,4 y la previsión ajustada estacionalmente para el primer período futuro (dic-93) es 273,2. por lo que el intervalo de confianza del 95 ajustada estacionalmente es 273,2-227,4 218,4 a 328,0 273.2227.4. La multiplicación de estos límites de los diciembre índice estacional de 68.61. obtenemos límites de confianza inferior y superior de 149,8 y 225,0 alrededor de la previsión punto Dic-93 de 187,4. los límites de confianza de las predicciones más de un período que se avecina en general, se ensanchan a medida que aumenta horizonte de pronóstico, debido a la incertidumbre sobre el nivel y la tendencia, así como los factores estacionales, pero es difícil de calcular en general mediante métodos analíticos. (La forma más adecuada para calcular los límites de confianza para el pronóstico del LES es mediante el uso de la teoría ARIMA, pero la incertidumbre en los índices estacionales es otro tema). Si desea un intervalo de confianza realista para una previsión de más de un período por delante, teniendo todas las fuentes de de error en cuenta, lo mejor es utilizar métodos empíricos: por ejemplo, para obtener un intervalo de confianza para un 2-paso por delante pronosticado, podría crear otra columna en la hoja de cálculo para calcular un pronóstico 2-paso adelante para cada periodo ( por bootstrapping la previsión de un paso por delante). A continuación, calcular el RMSE de los errores de pronóstico 2-paso adelante y utilizar esto como la base para un intervalo de confianza de 2 pasos de la ventaja.

No comments:

Post a Comment