Thursday 26 October 2017

Variação Sazonal Média Em Movimento


Médias móveis Se esta informação for plotada em um gráfico, parece assim: Isso mostra que há uma grande variação no número de visitantes, dependendo da estação. Há muito menos no outono e no inverno do que a primavera eo verão. No entanto, se queríamos ver uma tendência no número de visitantes, poderíamos calcular uma média móvel de 4 pontos. Fazemos isso ao encontrar o número médio de visitantes nos quatro trimestres de 2005: então encontramos o número médio de visitantes nos últimos três trimestres de 2005 e primeiro trimestre de 2006: os dois últimos trimestres de 2005 e os dois primeiros trimestres De 2006: note que a última média que podemos encontrar é nos últimos dois trimestres de 2006 e nos dois primeiros trimestres de 2007. Traçamos as médias móveis em um gráfico, certificando-se de que cada média é plotada no centro dos quatro trimestres Abrange: agora podemos ver que há uma tendência de queda muito pequena nos visitantes. Implementação da planilha de ajuste sazonal e alisamento exponencial. É direto realizar ajustes sazonais e ajustar modelos de suavização exponencial usando o Excel. As imagens de tela e os gráficos abaixo são tirados de uma planilha que foi configurada para ilustrar o ajuste sazonal multiplicativo e o alisamento exponencial linear nos seguintes dados de vendas trimestrais da Outboard Marine: Para obter uma cópia do próprio arquivo de planilha, clique aqui. A versão do alisamento exponencial linear que será usada aqui para fins de demonstração é a versão Brown8217s, apenas porque pode ser implementada com uma única coluna de fórmulas e há apenas uma constante de suavização para otimizar. Normalmente, é melhor usar a versão Holt8217s que possui constantes de suavização separadas para nível e tendência. O processo de previsão prossegue da seguinte forma: (i) primeiro os dados são ajustados sazonalmente (ii), então, as previsões são geradas para os dados dessazonalizados por meio de alisamento exponencial linear e (iii) finalmente, as previsões sazonalmente ajustadas são quantitativas para obter previsões para a série original . O processo de ajuste sazonal é realizado nas colunas D a G. O primeiro passo no ajuste sazonal é calcular uma média móvel centrada (realizada aqui na coluna D). Isso pode ser feito tomando a média de duas médias de um ano que são compensadas por um período relativo um ao outro. (Uma combinação de duas médias de compensação em vez de uma única média é necessária para fins de centralização quando o número de estações é igual.) O próximo passo é calcular a proporção para a média móvel - i. e. Os dados originais divididos pela média móvel em cada período - o que é realizado aqui na coluna E. (Isso também é chamado de quottrend-cyclequot componente do padrão, na medida em que os efeitos da tendência e do ciclo comercial podem ser considerados como sendo tudo isso Permanece após uma média de um ano inteiro de dados. Claro, mudanças mensais que não são devidas à sazonalidade podem ser determinadas por muitos outros fatores, mas a média de 12 meses suaviza sobre eles em grande medida.) O índice sazonal estimado para cada estação é calculado primeiro calculando a média de todas as proporções para essa estação particular, o que é feito nas células G3-G6 usando uma fórmula AVERAGEIF. Os índices médios são então redimensionados de modo que somam exatamente 100 vezes o número de períodos em uma estação, ou 400 neste caso, o que é feito nas células H3-H6. Abaixo na coluna F, as fórmulas VLOOKUP são usadas para inserir o valor do índice sazonal apropriado em cada linha da tabela de dados, de acordo com o trimestre do ano que representa. A média móvel centralizada e os dados sazonalmente ajustados ficam assim: note que a média móvel geralmente se parece com uma versão mais suave da série sazonalmente ajustada, e é mais curta em ambas as extremidades. Outra planilha no mesmo arquivo do Excel mostra a aplicação do modelo de alisamento exponencial linear aos dados dessazonalizados, começando na coluna G. Um valor para a constante de alisamento (alfa) é inserido acima da coluna de previsão (aqui, na célula H9) e Por conveniência, é atribuído o nome do intervalo quotAlpha. quot (O nome é atribuído usando o comando quotInsertNameCreatequot.) O modelo LES é inicializado definindo as duas primeiras previsões iguais ao primeiro valor real da série dessazonalizada. A fórmula usada aqui para a previsão LES é a forma recursiva de equação única do modelo Brown8217s: Esta fórmula é inserida na célula correspondente ao terceiro período (aqui, célula H15) e copiada para baixo a partir daí. Observe que a previsão LES para o período atual refere-se às duas observações anteriores e aos dois erros de previsão precedentes, bem como ao valor de alpha. Assim, a fórmula de previsão na linha 15 refere-se apenas a dados que estavam disponíveis na linha 14 e anteriores. (Claro que, se desejássemos usar um alisamento exponencial simples em vez de linear, podemos substituir a fórmula SES aqui. Poderíamos também usar Holt8217s em vez do modelo LES Brown8217s, o que exigiria mais duas colunas de fórmulas para calcular o nível e a tendência Que são usados ​​na previsão.) Os erros são computados na próxima coluna (aqui, coluna J) subtraindo as previsões dos valores reais. O erro quadrático médio equivocado é calculado como a raiz quadrada da variância dos erros mais o quadrado da média. (Isto segue a identidade matemática: VARIÂNCIA MSE (erros) (MÉDIA (erros)) 2. No cálculo da média e variância dos erros nesta fórmula, os dois primeiros períodos são excluídos porque o modelo na verdade não inicia a previsão até O terceiro período (linha 15 na planilha). O valor ideal de alfa pode ser encontrado alterando o alfa manualmente até encontrar o RMSE mínimo, ou então você pode usar o quotSolverquot para executar uma minimização exata. O valor de alfa que o Solver encontrou é mostrado aqui (alfa0.471). Geralmente é uma boa idéia traçar os erros do modelo (em unidades transformadas) e também calcular e traçar suas autocorrelações em atrasos de até uma estação. Aqui está uma série de séries temporais dos erros (ajustados sazonalmente): as autocorrelações de erro são calculadas usando a função CORREL () para calcular as correlações dos erros com elas mesmas atrasadas por um ou mais períodos - os detalhes são mostrados no modelo de planilha . Aqui está um enredo das autocorrelações dos erros nos primeiros cinco atrasos: as autocorrelações nos intervalos 1 a 3 são muito próximas de zero, mas o pico no intervalo 4 (cujo valor é 0,35) é um pouco incômodo - sugere que a O processo de ajuste sazonal não foi completamente bem sucedido. No entanto, na verdade, é apenas marginalmente significativo. 95 bandas de significância para testar se as autocorrelações são significativamente diferentes de zero são mais ou menos 2SQRT (n-k), onde n é o tamanho da amostra e k é o atraso. Aqui n é 38 e k varia de 1 a 5, então a raiz quadrada de n-menos-k é em torno de 6 para todos eles e, portanto, os limites para testar a significância estatística de desvios de zero são aproximadamente mais - Ou-menos 26, ou 0,33. Se você variar o valor de alfa à mão neste modelo do Excel, você pode observar o efeito sobre os gráficos de séries temporais e autocorrelação dos erros, bem como sobre o erro da raiz-médio-quadrado, que será ilustrado abaixo. Na parte inferior da planilha, a fórmula de previsão é citada no futuro, simplesmente substituindo as previsões por valores reais no ponto em que os dados reais se esgotaram - ou seja. Onde quotthe futurequot começa. (Em outras palavras, em cada célula onde um futuro valor de dados ocorreria, uma referência de célula é inserida, que aponta para a previsão feita para esse período.) Todas as outras fórmulas são simplesmente copiadas de cima: Observe que os erros para as previsões de O futuro é calculado para ser zero. Isso não significa que os erros reais serão zero, mas sim reflete apenas o fato de que, para fins de predição, estamos assumindo que os dados futuros serão iguais às previsões em média. As previsões resultantes para os dados dessazonalizados são assim: com este valor particular de alfa, otimizado para previsões de um período de antecedência, a tendência projetada é ligeiramente ascendente, refletindo a tendência local observada nos últimos 2 anos ou então. Para outros valores de alfa, uma projeção de tendência muito diferente pode ser obtida. Geralmente é uma boa idéia ver o que acontece com a projeção de tendência de longo prazo quando o alfa é variado, porque o valor que é melhor para a previsão de curto prazo não será necessariamente o melhor valor para prever o futuro mais distante. Por exemplo, aqui está o resultado que é obtido se o valor de alfa for ajustado manualmente para 0.25: A tendência de longo prazo projetada é agora negativa e não positiva. Com um menor valor de alfa, o modelo está colocando mais peso em dados mais antigos em A estimativa do nível e da tendência atuais e suas previsões de longo prazo refletem a tendência de queda observada nos últimos 5 anos em vez da tendência ascendente mais recente. Este gráfico também ilustra claramente como o modelo com um menor valor de alfa é mais lento para responder a pontos de referência nos dados e, portanto, tende a fazer um erro do mesmo sinal por vários períodos seguidos. Seus erros de previsão de 1 passo à frente são maiores em média do que os obtidos anteriormente (RMSE de 34,4 em vez de 27,4) e fortemente auto-correlacionados positivamente. A autocorrelação de lag-1 de 0,56 excede muito o valor de 0,33 calculado acima para um desvio estatisticamente significativo de zero. Como uma alternativa para diminuir o valor do alfa, a fim de introduzir mais conservadorismo em previsões de longo prazo, um fator de amortecimento de quotstend às vezes é adicionado ao modelo para que a tendência projetada se aplique depois de alguns períodos. O passo final na construção do modelo de previsão é quantificar as expectativas do LES, multiplicando-os pelos índices sazonais apropriados. Assim, as previsões não submetidas à coluna I são simplesmente o produto dos índices sazonais na coluna F e as previsões LES corrigidas sazonalmente na coluna H. É relativamente fácil calcular intervalos de confiança para as previsões de um passo antes feitas por este modelo: primeiro Computa o RMSE (erro da raiz-médio-quadrado, que é apenas a raiz quadrada do MSE) e depois calcula um intervalo de confiança para a previsão ajustada sazonalmente, adicionando e subtraindo duas vezes o RMSE. (Em geral, um intervalo de confiança 95 para uma previsão de um período anterior é aproximadamente igual ao ponto de previsão mais-ou-menos-duas vezes o desvio padrão estimado dos erros de previsão, assumindo que a distribuição do erro é aproximadamente normal e o tamanho da amostra É grande o suficiente, digamos, 20 ou mais. Aqui, o RMSE em vez do desvio padrão da amostra dos erros é a melhor estimativa do desvio padrão dos futuros erros de previsão porque leva também o viés, bem como as variações aleatórias em conta.) Os limites de confiança Para a previsão ajustada sazonalmente são então resgatados. Juntamente com a previsão, multiplicando-os pelos índices sazonais apropriados. Nesse caso, o RMSE é igual a 27,4 e a previsão ajustada sazonalmente para o primeiro período futuro (dezembro-93) é 273,2. Então o intervalo de confiança 95 ajustado sazonalmente é de 273,2-227,4 218,4 a 273,2227,4 328,0. Multiplicando esses limites pelo índice sazonal Decembers de 68,61. Obtemos limites de confiança inferiores e superiores de 149,8 e 225,0 em torno da previsão do ponto 93 de 187,4. Os limites de confiança para as previsões mais de um período adiante geralmente se ampliarão conforme o horizonte de previsão aumenta, devido à incerteza sobre o nível e a tendência, bem como os fatores sazonais, mas é difícil computá-los em geral por métodos analíticos. (A maneira apropriada de calcular os limites de confiança para a previsão LES é usando a teoria ARIMA, mas a incerteza nos índices sazonais é outra questão.) Se você quer um intervalo de confiança realista para uma previsão de mais de um período adiante, tomando todas as fontes de Erro em sua conta, sua melhor aposta é usar métodos empíricos: por exemplo, para obter um intervalo de confiança para uma previsão anterior de 2 passos, você poderia criar outra coluna na planilha para calcular uma previsão de duas etapas para cada período ( Ao inicializar a previsão de um passo a frente). Em seguida, calcule o RMSE dos erros de previsão de 2 passos e use isso como base para um intervalo de confiança de 2 passos. 6.2 Médias móveis, m. 40 elesales, ordem 5 41 Na segunda coluna desta tabela, uma média móvel Da ordem 5 é mostrado, fornecendo uma estimativa do ciclo de tendência. O primeiro valor nesta coluna é a média das cinco primeiras observações (1989-1993), o segundo valor na coluna 5-MA é a média dos valores 1990-1994 e assim por diante. Cada valor na coluna 5-MA é a média das observações no período de cinco anos centrado no ano correspondente. Não há valores nos dois primeiros anos ou nos últimos dois anos porque não temos duas observações em ambos os lados. Na fórmula acima, a coluna 5-MA contém os valores de chapéu com k2. Para ver como se parece a estimativa do ciclo de tendência, nós o traçamos juntamente com os dados originais na Figura 6.7. Planilha 40 elesales, quot principal de vendas de eletricidade residencial, ylab quotGWhot. Xlab quotYearquot 41 linhas 40 ma 40 elecsales, 5 41. col quotredquot 41 Observe como a tendência (em vermelho) é mais suave que os dados originais e captura o movimento principal das séries temporais sem todas as pequenas flutuações. O método de média móvel não permite estimativas de T onde t é próximo das extremidades da série, portanto, a linha vermelha não se estende às bordas do gráfico de cada lado. Mais tarde, usaremos métodos mais sofisticados de estimativa do ciclo de tendência que permitem estimativas próximas aos pontos finais. A ordem da média móvel determina a suavidade da estimativa do ciclo da tendência. Em geral, uma ordem maior significa uma curva mais suave. O gráfico a seguir mostra o efeito de alterar a ordem da média móvel para os dados residenciais de vendas de eletricidade. As médias móveis simples, como estas, geralmente são de ordem ímpar (por exemplo, 3, 5, 7, etc.). É assim que são simétricas: em uma média móvel da ordem m2k1, há k observações anteriores, k observações posteriores e a observação do meio Que estão em média. Mas se eu fosse igual, não seria mais simétrico. Médias móveis das médias móveis É possível aplicar uma média móvel a uma média móvel. Um dos motivos para isso é fazer uma média móvel em ordem uniforme simétrica. Por exemplo, podemos tomar uma média móvel da ordem 4 e, em seguida, aplicar outra média móvel da ordem 2 aos resultados. Na Tabela 6.2, isso foi feito nos primeiros anos dos dados de produção de cerveja trimestral australiana. Beer2 lt - window 40 ausbeer, começar 1992 41 ma4 lt-ma 40 beer2, order 4. center FALSE 41 ma2x4 lt-ma 40 beer2, order 4. center TRUE 41 A notação 2times4-MA na última coluna significa 4-MA Seguido por um 2-MA. Os valores na última coluna são obtidos tomando uma média móvel da ordem 2 dos valores na coluna anterior. Por exemplo, os dois primeiros valores na coluna 4-MA são 451.2 (443410420532) 4 e 448.8 (410420532433) 4. O primeiro valor na coluna 2times4-MA é a média desses dois: 450.0 (451.2448.8) 2. Quando um 2-MA segue uma média móvel de ordem par (como 4), é chamado de média móvel centrada da ordem 4. Isso ocorre porque os resultados agora são simétricos. Para ver que este é o caso, podemos escrever o 2times4-MA da seguinte forma: comece o amplificador de amplificação. Bigfrac (y y y y) frac (y y y y) Grande amplificação fractura fractura fratão frac14y frac14y frac18y. Fim É agora uma média ponderada de observações, mas é simétrico. Outras combinações de médias móveis também são possíveis. Por exemplo, um 3x3-MA é freqüentemente usado e consiste em uma média móvel da ordem 3, seguida de outra média móvel da ordem 3. Em geral, uma ordem final MA deve ser seguida por uma ordem final MA para torná-la simétrica. Da mesma forma, uma ordem ímpar MA deve ser seguida por uma ordem ímpar MA. Estimando o ciclo de tendência com dados sazonais O uso mais comum de médias móveis centradas é estimar o ciclo de tendência a partir de dados sazonais. Considere o 2x4-MA: fractura de fractura e fractura fratura de fractura. Quando aplicado a dados trimestrais, cada trimestre do ano recebe peso igual à medida que o primeiro e o último termos se aplicam ao mesmo trimestre em anos consecutivos. Consequentemente, a variação sazonal será promediada e os valores resultantes do chapéu t terão pouca ou nenhuma variação sazonal restante. Um efeito semelhante seria obtido usando um 2x 8-MA ou um 2x 12-MA. Em geral, 2 vezes m-MA é equivalente a uma média móvel ponderada da ordem m1 com todas as observações tomando peso 1m, exceto para os primeiros e últimos termos que tomam pesos 1 (2m). Então, se o período sazonal é igual e de ordem m, use um 2-m-MA para estimar o ciclo da tendência. Se o período sazonal for estranho e de ordem m, use um m-MA para estimar o ciclo de tendências. Em particular, um 2x 12-MA pode ser usado para estimar o ciclo de tendência dos dados mensais e um 7-MA pode ser usado para estimar o ciclo de tendência dos dados diários. Outras opções para a ordem do MA geralmente resultarão em estimativas do ciclo de tendência sendo contaminadas pela sazonalidade nos dados. Exemplo 6.2 Fabricação de equipamentos elétricos A Figura 6.9 mostra um 2x12-MA aplicado ao índice de pedidos de equipamentos elétricos. Observe que a linha suave mostra nenhuma sazonalidade é quase o mesmo que o ciclo de tendência mostrado na Figura 6.2, que foi estimado usando um método muito mais sofisticado do que as médias móveis. Qualquer outra escolha para a ordem da média móvel (exceto 24, 36, etc.) teria resultado em uma linha suave que mostra algumas flutuações sazonais. Lote 40 elecequip, ylab quotNome ordem de pedidos. Quotgrayquot quotgrayquot principal quotEquipamento de equipamentos elétricos (área do euro) 41 linhas 40 ma 40 elecequip, ordem 12 41. col quotredquot 41 médias móveis ponderadas As combinações de médias móveis resultam em médias móveis ponderadas. Por exemplo, o 2x4-MA discutido acima é equivalente a um 5-MA ponderado com pesos dados por frac, frac, frac, frac, frac. Em geral, um m-MA ponderado pode ser escrito como hat t sum k aj y, onde k (m-1) 2 e os pesos são dados por a, pontos, ak. É importante que todos os pesos somem para um e que sejam simétricos para que aj. O m-MA simples é um caso especial em que todos os pesos são iguais a 1m. Uma grande vantagem das médias móveis ponderadas é que eles produzem uma estimativa mais suave do ciclo da tendência. Em vez das observações que entram e saem do cálculo em peso total, seus pesos aumentam lentamente e diminuem lentamente resultando em uma curva mais suave. Alguns conjuntos específicos de pesos são amplamente utilizados. Alguns destes são apresentados na Tabela 6.3.

No comments:

Post a Comment