Monday, 6 November 2017

Ejemplos De Media Móvil De Series De Tiempo


Media móvil Este ejemplo le enseña cómo calcular el promedio móvil de una serie de tiempo en Excel. Una gran ventaja se utiliza para suavizar las irregularidades (picos y valles) para reconocer fácilmente las tendencias. 1. En primer lugar, echemos un vistazo a nuestra serie de tiempo. 2. En la ficha Datos, haga clic en Análisis de datos. Nota: no puede encontrar el botón Análisis de datos Haga clic aquí para cargar el complemento Herramientas de análisis. 3. Seleccione Media móvil y haga clic en Aceptar. 4. Haga clic en el cuadro Rango de entrada y seleccione el rango B2: M2. 5. Haga clic en el cuadro Interval y escriba 6. 6. Haga clic en el cuadro Rango de salida y seleccione la celda B3. 8. Trazar un gráfico de estos valores. Explicación: dado que establecemos el intervalo en 6, el promedio móvil es el promedio de los 5 puntos de datos anteriores y el punto de datos actual. Como resultado, los picos y valles se suavizan. El gráfico muestra una tendencia creciente. Excel no puede calcular el promedio móvil para los primeros 5 puntos de datos porque no hay suficientes puntos de datos anteriores. 9. Repita los pasos 2 a 8 para el intervalo 2 y el intervalo 4. Conclusión: Cuanto mayor sea el intervalo, más se suavizarán los picos y los valles. Cuanto más pequeño sea el intervalo, más cerca estarán las medias móviles de los puntos de datos reales. Los datos de suavizado eliminan la variación aleatoria y muestran las tendencias y los componentes cíclicos Inherente a la recolección de datos tomados en el tiempo es alguna forma de variación aleatoria. Existen métodos para reducir la cancelación del efecto debido a la variación aleatoria. Una técnica frecuentemente utilizada en la industria es suavizar. Esta técnica, cuando se aplica correctamente, revela más claramente la tendencia subyacente, los componentes estacionales y cíclicos. Existen dos grupos distintos de métodos de suavizado Métodos de promedio Métodos exponenciales de suavizado Tomar promedios es la forma más sencilla de suavizar los datos Primero investigaremos algunos métodos de promediación, como el promedio simple de todos los datos anteriores. Un gerente de un almacén quiere saber cuánto un proveedor típico ofrece en unidades de 1000 dólares. Se toma una muestra de 12 proveedores, al azar, obteniendo los siguientes resultados: La media o media calculada de los datos 10. El gestor decide usar esto como la estimación para el gasto de un proveedor típico. ¿Es esto una buena o mala estimación? El error cuadrático medio es una forma de juzgar qué tan bueno es un modelo Vamos a calcular el error cuadrático medio. La cantidad verdadera del error gastada menos la cantidad estimada. El error al cuadrado es el error anterior, al cuadrado. El SSE es la suma de los errores al cuadrado. El MSE es la media de los errores al cuadrado. Resultados de MSE por ejemplo Los resultados son: Errores y errores cuadrados La estimación 10 La pregunta surge: ¿podemos usar la media para pronosticar ingresos si sospechamos una tendencia? Un vistazo a la gráfica abajo muestra claramente que no debemos hacer esto. El promedio pesa todas las observaciones pasadas igualmente En resumen, declaramos que El promedio simple o la media de todas las observaciones pasadas es sólo una estimación útil para pronosticar cuando no hay tendencias. Si hay tendencias, utilice estimaciones diferentes que tengan en cuenta la tendencia. El promedio pesa todas las observaciones pasadas igualmente. Por ejemplo, el promedio de los valores 3, 4, 5 es 4. Sabemos, por supuesto, que un promedio se calcula sumando todos los valores y dividiendo la suma por el número de valores. Otra forma de calcular el promedio es añadiendo cada valor dividido por el número de valores, o 3/3 4/3 5/3 1 1.3333 1.6667 4. El multiplicador 1/3 se llama el peso. En general: barra frac fracción izquierda (frac derecha) x1 izquierda (frac derecha) x2,. ,, Izquierda (frac derecha) xn. Ejemplo de serie temporal Los siguientes ejemplos ilustran cómo se puede utilizar XLMiner para explorar los datos para descubrir tendencias y estacionalidades. En la cinta de XLMiner, en la ficha Aplicación de su modelo, seleccione Ayuda - Ejemplos. Luego Ejemplos de predicción / minería de datos y abra el conjunto de datos de ejemplo, Income. xlsx. Este conjunto de datos contiene el ingreso promedio de los contribuyentes por estado. Normalmente, los siguientes pasos se realizan en un análisis de series de tiempo. 1. Los datos se dividen en dos conjuntos con 60 de los datos asignados al conjunto de entrenamiento y 40 asignados al conjunto de validación. 2. Se aplican técnicas exploratorias a los conjuntos de entrenamiento y validación. Si los resultados están sincronizados, entonces el modelo puede ser ajustado. Si los gráficos ACF y PACF son los mismos, entonces se puede utilizar el mismo modelo para ambos conjuntos. 3. El modelo se ajusta utilizando el método ARIMA (Autoregressive Integrated Moving Average). 4. Cuando se ajusta un modelo utilizando el método ARIMA, XLMiner muestra los gráficos ACF y PACF para los residuos. Si estas parcelas están en la banda de UCL y LCL, entonces los residuos son aleatorios y el modelo es adecuado. 5. Si los residuos no están dentro de las bandas, entonces existen algunas correlaciones, y el modelo debe ser mejorado. Primero, realice una partición en los datos. Seleccione una celda dentro del conjunto de datos y, a continuación, en el ribboon de XLMiner, en la ficha Serie temporal, seleccione Partición para abrir el cuadro de diálogo Datos de partición de series temporales. En la lista Variables, seleccione Año y haga clic en gt para desplazarse a Variable de tiempo. Seleccione las variables restantes en la lista Variables y haga clic en gt para incluirlas en la lista Variables de la lista de particiones. En Especificar opciones de partición, seleccione Especificar registros para especificar el número de registros asignados a los conjuntos de formación y validación. En Especificar registros para partición, seleccione Especificar registros, luego escriba 50 para el número de registros de conjuntos de entrenamiento y 21 para el número de registros de conjuntos de validación. Si Especificar porcentajes está seleccionado en Especificar opciones de partición, XLMiner asigna un porcentaje de registros a cada conjunto de acuerdo con los valores introducidos por el usuario o introducidos automáticamente por XLMiner en Especificar porcentajes para particionar. Haga clic en Aceptar . La hoja de trabajo DataPartitionTS se inserta a la derecha de la hoja de cálculo de Ingresos. En la salida anterior, el método de partición es secuencial (versus aleatorio). Las primeras 50 observaciones han sido asignadas al Conjunto de Entrenamiento y las restantes 21 observaciones han sido asignadas al Conjunto de Validación. Seleccione una celda en la hoja de trabajo DataPartitionTS y, a continuación, en la cinta XLMiner, en la ficha Serie temporal, seleccione ARIMA - Autocorrelaciones para mostrar el cuadro de diálogo ACF. Seleccione CA como variable seleccionada, introduzca 10 para los parámetros ACF para datos de formación y datos de validación. El gráfico ACF de trazado está seleccionado de forma predeterminada. Haga clic en Aceptar . La hoja de cálculo ACFOutput se inserta después de la hoja de datos DataPartitionTS. Obsérvese en cada gráfico que la autocorrelación disminuye a medida que aumenta el número de desfases. Esto sugiere que existe un patrón definido en cada partición. Sin embargo, dado que el patrón no se repite, puede suponerse que no se incluye estacionalidad en los datos. Además, dado que ambos gráficos muestran un patrón similar, podemos encajar el mismo modelo tanto en los conjuntos de validación como de entrenamiento. Haga clic de nuevo en la hoja de trabajo DataPartitionTS y en la cinta XLMiner, en la ficha Serie de tiempo, seleccione ARIMA - Autocorrelaciones parciales para abrir el cuadro de diálogo PACF. Seleccione CA en la lista Variables In Input Data (Datos de entrada) y, a continuación, gt para mover la variable a Selected variable (Variable seleccionada). Introduzca 40 para Lag máximo en Parámetros PACF para datos de entrenamiento y 15 para Parámetros PACF para datos de validación. El gráfico PACF de trazado está seleccionado de forma predeterminada. Haga clic en Aceptar . La hoja de cálculo ACFOutput se inserta directamente a la derecha de la hoja de cálculo DataPartitionTS. Ambos parcelas PACF muestran patrones similares en los conjuntos de validación y formación. Como resultado, podemos usar el mismo modelo para ambos conjuntos. Salida PACF para datos de entrenamiento Salida PACF para datos de validación La función PACF muestra un patrón definido, lo que significa que hay una tendencia en los datos. Sin embargo, dado que el patrón no se repite, podemos concluir que los datos no muestran ninguna estacionalidad. Tanto los gráficos ACF como PACF sugieren que existe un patrón definido, pero sin ninguna estacionalidad. Ambos conjuntos de datos muestran el mismo comportamiento en los conjuntos de entrenamiento y validación, lo que sugiere que el mismo modelo es apropiado para cada uno. Ahora estamos listos para adaptarnos al modelo. El modelo ARIMA acepta tres parámetros: p - el número de términos autorregresivos d - el número de diferencia no estacional, y q - el número de errores rezagados (promedios móviles). Recuérdese que la gráfica ACF no mostró estacionalidad en los datos, lo que significa que la autocorrelación es casi estática, disminuyendo con el número de desfases en aumento. Esto sugiere establecer q 0 ya que parece que no hay errores rezagados. La gráfica PACF mostró un valor grande para el primer retraso, pero parcelas mínimas para retrasos sucesivos. Esto sugiere establecer p 1. Con la mayoría de los conjuntos de datos, establecer d 1 es suficiente o puede ser al menos un punto de partida. Haga clic de nuevo en la hoja de trabajo DataPartitionTS y en la cinta de XLMiner, en la ficha Series temporales, seleccione el modelo ARIMA - ARIMA para abrir el cuadro de diálogo Serie temporal - ARIMA. Seleccione CA en la lista Variables In Input Data (Datos de entrada) y, a continuación, gt para mover la variable al campo Selected variable (Variable seleccionada). En Parámetros no estacionales, establezca Autoregresivo (p) en 1, Diferencia (d) en 1 y Promedio móvil (q) en 0. Haga clic en Avanzado para abrir el cuadro de diálogo Opciones avanzadas de ARIMA. Seleccione Valores ajustados y residuos, Produzca pronósticos e Informe intervalos de confianza de previsión. El ajuste de nivel de confianza predeterminado de 95 se introduce automáticamente. La matriz de varianza-covarianza se selecciona de forma predeterminada. Haga clic en Aceptar en el cuadro de diálogo Opciones avanzadas de ARIMA y de nuevo en el cuadro de diálogo Serie temporal - ARIMA. XLMiner calcula y muestra varios parámetros y gráficos en dos hojas de salida, ARIMAOutput y ARIMAResiduals. La hoja de cálculo ARIMAOutput contiene el modelo ARIMA, que se muestra a continuación. En esta misma hoja de cálculo, XLMiner ha calculado el término constante y el término AR1 para nuestro modelo. Estos son los términos constantes y f1 de la ecuación de predicción. Ver la siguiente salida de la prueba de Chi-cuadrado. El pequeño valor de p para el término constante (0.9704) y AR1 término (0) sugiere que el modelo es un buen ajuste a nuestros datos. Abra la hoja de cálculo ARIMAResiduals. Esta tabla representa los valores reales y ajustados y los residuos resultantes. Como se muestra en el gráfico de abajo, los valores reales y previstos coinciden bastante bien. La utilidad del modelo en la predicción dependerá de cuán cerca estén los valores reales y previstos en el gráfico de tiempo del conjunto de validación. A continuación, veremos los gráficos ACF y PACF para Errores que se encuentran en la parte inferior de la hoja de cálculo ARIMAOutput. Todos los rezagos, excepto el retraso 1, están claramente dentro de las bandas UCL y LCL. Esto indica que los residuos son aleatorios y no están correlacionados, que es la primera indicación de que los parámetros del modelo son adecuados para estos datos. Consulte la tabla Pronóstico en la hoja de cálculo ARIMAOutput. La tabla muestra el valor actual y el valor pronosticado. Los valores inferior y superior representan los límites inferior e superior del intervalo de confianza. Hay una probabilidad 95 de que el valor pronosticado caiga en este rango. El gráfico de tiempo a la derecha indica cómo el modelo, que hemos instalado utilizando el conjunto de entrenamiento y realizado en el conjunto de validación. Los valores reales y previstos son bastante cercanos, lo que confirma que nuestro modelo debe ser bueno para la previsión. Para trazar los valores en la columna inferior y superior en el mismo gráfico, seleccione el gráfico y, a continuación, en la cinta de Excel, seleccione Diseño - Seleccionar datos para abrir el cuadro de diálogo Seleccionar origen de datos. Para el rango de datos del gráfico, escriba ARIMAOutputB56: G77. Luego desmarque Error en Entradas de leyenda. Haga clic en Aceptar . Esta gráfica muestra que los valores real y previsto están dentro de las bandas de nivel de confianza inferior y superior 95. Aunque los valores reales fluctúan un poco, estos valores caen dentro del centro del rango. Podemos concluir a partir de la salida ARIMA, que nuestro modelo utilizando los parámetros (1, 1, 0) se ha demostrado adecuadamente ajustar los datos.

No comments:

Post a Comment