Tuesday 31 October 2017

Moving Media E Esponenziale Smoothing Modelli


Previsione lisciando Tecniche Questo sito è parte del JavaScript e-laboratori oggetti per il processo decisionale di apprendimento. Altri JavaScript in questa serie sono suddivise in diverse aree di applicazione nella sezione MENU in questa pagina. Una serie temporale è una sequenza di osservazioni che vengono ordinati nel tempo. Inerente la raccolta di dati assunto nel tempo è una forma di variazione casuale. Esistono metodi per ridurre di annullare l'effetto dovuto alla variazione casuale. Ampiamente tecniche utilizzate sono levigante. Queste tecniche, se applicato correttamente, rivela più chiaramente le tendenze di fondo. Inserire le serie storiche Riga-saggio in sequenza, a partire dall'angolo sinistro in alto, e il parametro (s), quindi fare clic sul pulsante Calcola per ottenere la previsione di un periodo avanti. caselle vuote non sono inclusi nei calcoli, ma gli zeri sono. In introdurre i dati per passare da cellula a cellula nel data-matrix utilizzare il tasto Tab non freccia o inserire le chiavi. Caratteristiche di serie temporali, che potrebbero essere rivelato esaminando il suo grafico. con i valori previsti, e il comportamento dei residui, la modellazione di previsione condizione. Medie mobili: Le medie mobili sono tra le tecniche più popolari per la pre-elaborazione delle serie storiche. Essi sono utilizzati per filtrare il rumore bianco casuale dai dati, per rendere più agevole la serie storica o anche per sottolineare alcuni componenti informativi contenuti nelle serie temporali. Esponenziale: Questo è uno schema molto popolare per la produzione di una serie storica levigata. Considerando che le medie mobili osservazioni passate hanno lo stesso peso, esponenziale assegna in modo esponenziale diminuzione pesi come l'osservazione invecchiano. In altre parole, osservazioni recenti sono date relativamente più peso nella previsione che le osservazioni più anziani. Doppia esponenziale è meglio alle tendenze di manipolazione. Triple esponenziale è meglio a gestire le tendenze parabola. Una media mobile exponenentially ponderata con una costante livellamento a. corrisponde all'incirca ad una media mobile semplice di lunghezza (cioè periodo) n, dove n e sono legati da: 2 (n1) o N (2 - a) a. Così, per esempio, una media mobile exponenentially ponderato con una lisciatura costante pari a 0,1 corrisponderebbe all'incirca ad una media mobile 19 giorni. E una media mobile semplice di 40 giorni corrisponderebbe grosso modo a una media mobile esponenziale ponderata con una costante livellamento pari a 0,04,878 mila. Holts lineare esponenziale: Supponiamo che la serie temporale è non stagionale, ma fa tendenza del display. Metodo Holts stima sia il livello attuale e la tendenza attuale. Si noti che la media mobile semplice è caso particolare di livellamento esponenziale impostando il periodo di media mobile per la parte intera di (2-Alpha) Alpha. Per la maggior parte dei dati aziendali un parametro Alpha minore di 0,40 è spesso efficace. Tuttavia, si può eseguire una ricerca a griglia dello spazio dei parametri, con 0.1 al 0.9, con incrementi di 0,1. Quindi il miglior alfa ha il più piccolo errore assoluto medio (MA errore). Come confrontare diversi metodi di lisciatura: Anche se ci sono indicatori numerici per valutare l'accuratezza della tecnica di previsione, l'approccio più ampiamente è nell'uso confronto visivo di diverse previsioni per valutare la loro accuratezza e scegliere tra i vari metodi di previsione. In questo approccio, si deve tracciare (utilizzando, ad esempio Excel) sullo stesso grafico i valori originali di una variabile serie storiche ei valori previsti di diversi metodi di previsione diversi, facilitando in tal modo un confronto visivo. È possibile, come proiettando le ipotesi precedenti, levigando Tecniche JavaScript per ottenere i valori di previsione passato in base ad smoothing tecniche che utilizzano il parametro unico singolo. Holt e Winters metodi utilizzano due e tre parametri, rispettivamente, quindi non è un compito facile per selezionare l'ottimale, o anche vicine ai valori ottimali per tentativi ed errori per i parametri. Il singolo di livellamento esponenziale sottolinea la prospettiva a corto raggio si imposta il livello di all'ultima osservazione e si basa a condizione che non vi è alcuna tendenza. La regressione lineare, che si inserisce una linea minimi quadrati ai dati storici (o dati storici trasformati), rappresenta il lungo raggio, che è condizionato sull'andamento base. Holts livellamento esponenziale lineare acquisisce informazioni sulla recente tendenza. I parametri nel modello Holts è livelli-parametro che dovrebbe essere diminuita quando la quantità di variazione dei dati è grande, e tendenze a parametro dovrebbe essere aumentato se la direzione recente tendenza è sostenuta dalla causale alcuni fattori. Previsione a breve termine: Si noti che ogni JavaScript in questa pagina fornisce una previsione one-step-avanti. Per ottenere una previsione in due fasi-avanti. è sufficiente aggiungere il valore previsto per la fine di voi dati di serie temporali e quindi fare clic sullo stesso pulsante Calcola. Si può ripetere questo processo per un paio di volte al fine di ottenere la necessaria forecasts. Averaging a breve termine e modelli di livellamento esponenziale Come primo passo per migliorare sui modelli di previsione ingenui, i modelli non stagionali e le tendenze possono essere estrapolati utilizzando una media mobile o lisciatura modello. L'assunto di base dietro media e modelli di livellamento è che la serie temporale è localmente stazionario con una media lentamente variabile. Quindi, prendiamo un movimento (cioè locale) media per stimare il valore corrente della media, e utilizzare questo come la previsione. Questo può essere considerato come un compromesso tra il modello medio e il modello random walk. La media mobile è spesso chiamato una versione levigata della serie originale, dal momento che la media a breve termine ha l'effetto di appianare i dossi nella serie originale. Regolando il grado di lisciatura (cioè l'ampiezza della media mobile), possiamo sperare di colpire un qualche tipo di equilibrio ottimale tra le prestazioni dei modelli medi e random walk. Il tipo più semplice di modello di media è il. Semplice (altrettanto ponderata) media mobile: Qui, la previsione Yacute un periodo avanti (t), al momento t-1, è pari alla media semplice delle ultime osservazioni k. Questa media è centrato periodo t - (k1) 2, il che implica che la stima della media locale tenderà a restare indietro il vero valore della media locale circa (k1) 2 periodi. Così, diciamo l'età media dei dati nella media mobile semplice è (k1) 2 rispetto al periodo per il quale è calcolata la previsione: questa è la quantità di tempo per cui previsioni tenderanno a restare indietro ruotando punti nei dati . Ad esempio, se si sta una media degli ultimi 5 valori, le previsioni saranno circa 3 periodi in ritardo nel rispondere a punti di svolta. Si noti che se k1, il modello semplice media mobile (SMA) è equivalente al modello random walk (senza crescita). Se k è molto grande (paragonabile alla lunghezza del periodo di stima), il modello SMA è equivalente al modello medio. Come con qualsiasi parametro di un modello di previsione, è consuetudine per regolare il valore di k per ottenere il migliore adattamento ai dati, cioè i più piccoli errori di previsione in media. Ecco un esempio di una serie che sembra mostrare fluttuazioni casuali intorno a una media lentamente variabile. Innanzitutto, proviamo per adattarsi con un modello casuale, che è equivalente a una media mobile semplice di 1 termine: Il modello random walk risponde molto velocemente alle variazioni della serie, ma così facendo raccoglie gran parte del rumore nel dati (le fluttuazioni casuali) nonché il segnale (la media locale). Se invece cerchiamo una semplice media mobile di 5 termini, si ottiene un insieme più agevole dall'aspetto delle previsioni: Il 5-termine mobile semplice rese medie in modo significativo gli errori più piccoli rispetto al modello random walk in questo caso. L'età media dei dati di questa previsione è 3 ((51) 2), in modo che tende a ritardo punti di svolta da circa tre periodi. (Per esempio, una flessione sembra essersi verificato in periodo di 21, ma le previsioni non girare intorno fino a diversi periodi più tardi.) Si noti che le previsioni a lungo termine dal modello SMA sono una retta orizzontale, proprio come nel random walk modello. Pertanto, il modello SMA presuppone che vi sia alcuna tendenza nei dati. Tuttavia, mentre le previsioni del modello random walk sono semplicemente uguale all'ultimo valore osservato, le previsioni del modello di SMA sono pari ad una media ponderata dei valori ultimi. È interessante notare che i limiti di confidenza calcolati da Statgraphics per le previsioni a lungo termine della media mobile semplice non ottengono più ampio con l'aumento della previsione all'orizzonte. Questo ovviamente non è corretto Purtroppo, non vi è alcuna teoria statistica di fondo che ci dice come gli intervalli di confidenza deve ampliare per questo modello. Se si dovesse andare ad utilizzare questo modello, in pratica, si farebbe bene a usare una stima empirica dei limiti di confidenza per le previsioni di più lungo orizzonte. Ad esempio, è possibile impostare un foglio di calcolo in cui il modello SMA sarebbe stato utilizzato per prevedere 2 passi avanti, 3 passi avanti, ecc all'interno del campione di dati storici. È quindi possibile calcolare le deviazioni standard campione degli errori in ogni orizzonte di previsione, e quindi la costruzione di intervalli di confidenza per le previsioni a lungo termine aggiungendo e sottraendo multipli della deviazione standard appropriato. Se cerchiamo una media del 9 termine semplice movimento, otteniamo le previsioni ancora più fluide e più di un effetto ritardo: L'età media è ora 5 punti ((91) 2). Se prendiamo una media mobile 19-termine, l'età media aumenta a 10: Si noti che, in effetti, le previsioni sono ora in ritardo punti di svolta da circa 10 periodi. Browns semplice esponenziale (media mobile esponenziale ponderata) Il modello a media mobile semplice di cui sopra ha la proprietà indesiderabile che tratta le ultime osservazioni k ugualmente e completamente ignora tutte le osservazioni che precedono. Intuitivamente, dati passati devono essere attualizzati in modo più graduale - per esempio, il più recente osservazione dovrebbe avere un peso poco più di 2 più recente, e la 2 più recente dovrebbe ottenere un po 'più peso che la 3 più recente, e presto. Il modello semplice di livellamento esponenziale (SES) realizza questo. Sia denotare un smoothing costante (un numero compreso tra 0 e 1) e sia S (t) il valore della serie livellato periodo t. La formula seguente viene utilizzata in modo ricorsivo per aggiornare la serie lisciato come nuove osservazioni vengono registrate: Così, il valore lisciato corrente è una interpolazione tra il valore livellato precedente e l'osservazione corrente, dove controlla la vicinanza del valore interpolato alla più recente osservazione. Le previsioni per il prossimo periodo è semplicemente il valore livellato corrente: (Nota: ci sarà d'ora in poi usiamo il simbolo Yacute riposare per una previsione della serie storica Y, perché Yacute è la cosa più vicina ad una y-cappello che può essere visualizzato su . una pagina web) Equivalentemente, si può esprimere la successiva meteo direttamente in termini di previsioni precedenti e osservazioni precedenti, in uno dei seguenti modi: Yacute (t1) Y (t) (1-) Yacute (t). forecastinterpolation tra la precedente previsione e precedenti Yacute osservazione (t1) Yacute (t) e (t). meteo forecastprevious inclusa frazione di errore precedente, dove e (t) Y (t) - Y (t) Yacute (t1) Y (t) - (1-) e (t). forecastprevious osservazione frazione meno 1- dell'errore precedente Yacute (t1) Y (t) (1-) Y (t-1) ((1-) 2) Y (t-2) ((1-) 3) Y (t -3). . Previsioni esponenzialmente ponderata (cioè scontato) media mobile con fattore di sconto 1- Le precedenti quattro equazioni sono tutti --any matematicamente equivalenti uno di essi può essere ottenuta con riarrangiamento di una qualsiasi delle altre. La prima equazione di cui sopra è probabilmente il più facile da usare se si implementa il modello su un foglio di calcolo: la formula di previsione si inserisce in una singola cellula e contiene i riferimenti di cella che puntano alla previsione precedente, l'osservazione precedente, e la cella in cui il valore di è immagazzinato. Si noti che se 1, il modello SES è equivalente ad un modello random walk (senza crescita). Se 0, il modello SES è equivalente al modello medio, assumendo che il primo valore livellato è impostata uguale alla media. L'età media dei dati nella previsione semplice-esponenziale-smoothing è 1 relativa al periodo per il quale è calcolata la previsione. (Questo non dovrebbe essere ovvio, ma può essere facilmente dimostrare valutando una serie infinita.) Quindi, la semplice previsione media mobile tende a restare indietro punti di svolta da circa 1 periodi. Ad esempio, quando 0,5 il ritardo è di 2 periodi in cui 0,2 il ritardo è di 5 periodi in cui 0.1 il ritardo è di 10 periodi, e così via. Per una data età media (cioè quantità di ritardo), il semplice livellamento esponenziale (SES) previsione è un po 'superiore alla previsione media mobile semplice (SMA) perché pone relativamente più peso sulla più recente --i. e osservazione. è un po 'più reattivo ai cambiamenti che si verificano nel recente passato. Un altro importante vantaggio del modello SES sul modello SMA è che il modello SES utilizza un parametro smoothing che è continuamente variabile, in modo che possa facilmente ottimizzata utilizzando un algoritmo risolutore per minimizzare l'errore quadratico medio. Il valore ottimale di un modello SES a questa serie risulta essere 0,2961, come illustrato di seguito: L'età media dei dati in questa previsione è 10.2961 3.4 periodi, che è simile a quella di una media 6 termine mobile semplice. Le previsioni a lungo termine dal modello SES sono una linea retta orizzontale. come nel modello SMA e il modello random walk senza crescita. Si noti tuttavia che gli intervalli di confidenza calcolati da Statgraphics ora divergono in modo ragionevole dall'aspetto, e che sono sostanzialmente più stretto gli intervalli di confidenza per il modello random walk. Il modello di SES presuppone che la serie è un po 'più prevedibile di quanto non faccia il modello random walk. Un modello SES è in realtà un caso particolare di un modello ARIMA, così la teoria statistica dei modelli ARIMA fornisce una solida base per il calcolo intervalli di confidenza per il modello SES. In particolare, un modello SES è un modello ARIMA con una differenza nonseasonal, un MA (1) termine, e nessun termine costante. altrimenti noto come un modello ARIMA (0,1,1) senza costante. Il MA (1) coefficiente nel modello ARIMA corrisponde alla quantità 1- nel modello SES. Ad esempio, se si adatta un modello ARIMA (0,1,1) senza costante alla serie analizzate qui, il MA stimato (1) coefficiente risulta essere 0,7029, che è quasi esattamente un meno 0,2961. È possibile aggiungere l'assunzione di una tendenza non-zero costante lineare per un modello SES. Per fare questo in Statgraphics, basta specificare un modello ARIMA con una differenza non stagionale e di un (1) termine MA con una costante, cioè un (0,1,1) modello ARIMA con costante. Le previsioni a lungo termine avranno quindi una tendenza che è uguale alla tendenza medio rilevato nel corso dell'intero periodo di stima. Non si può fare questo in collaborazione con destagionalizzazione, perché le opzioni di destagionalizzazione sono disattivati ​​quando il tipo di modello è impostato su ARIMA. Tuttavia, è possibile aggiungere una costante a lungo termine tendenza esponenziale ad un semplice modello di livellamento esponenziale (con o senza regolazione stagionale) utilizzando l'opzione di regolazione inflazione nella procedura di previsione. Il tasso di inflazione appropriata (crescita percentuale) per periodo può essere stimato come il coefficiente di pendenza in un modello trend lineare adattato ai dati in combinazione con una trasformazione logaritmo naturale, oppure può essere basata su altre informazioni indipendenti relative prospettive di crescita a lungo termine . Browns lineare (cioè doppio) esponenziale Se la tendenza, così come la media è variabile lentamente nel tempo, un modello di livellamento di ordine superiore è necessario totrack la tendenza varia. Il modello di tendenza tempo-variante più semplice è Browns lineare modello esponenziale smoothing (LES), che utilizza due diverse serie levigato che sono centrate in diversi punti nel tempo. La formula di previsione si basa su un'estrapolazione di una linea attraverso i due centri. (In alternativa, una doppia applicazione del metodo semplice media mobile può essere utilizzato per tenere traccia delle tendenze che variano nel tempo - vedere le pagine 154-158 nel libro di testo.) La forma algebrica del modello di livellamento esponenziale lineare, come quella della semplice livellamento esponenziale modello può essere espresso in un certo numero di forme diverse ma equivalenti. La forma standard di questo modello è di solito espressa come segue: Sia S denotano la serie singolarmente-levigata ottenuta applicando semplice livellamento esponenziale di serie Y. Cioè, il valore di S al periodo t è dato da: (Ricordiamo che, in semplice livellamento esponenziale, ci sarebbe solo lasciare Yacute (t1) S (t) a questo punto) Allora S la serie doppiamente levigata ottenuta applicando semplice livellamento esponenziale (utilizzando lo stesso) per serie S:. Infine, la previsione Yacute ( t1) è data da: a (t) 2S (t) - S (t). il livello stimato in periodo t Previsioni con tempi di consegna più lunghi effettuate in periodo t si ottiene sommando i multipli del termine tendenza. Ad esempio, la previsione k-periodo avanti (cioè il tempo a Y (tk) fatta al periodo t) sarebbe pari a (t) kb (t). Ai fini del modello-montaggio (cioè le previsioni, i residui e le statistiche residue oltre il periodo di stima calcolo), il modello può essere avviato impostando S (1) S (1) Y (1), vale a dire impostare entrambe le serie lisciato pari a il valore osservato t1. Una forma matematicamente equivalente di Browns lineare modello di livellamento esponenziale, che sottolinea il carattere non stazionaria ed è più facile da implementare su un foglio di calcolo, è la seguente: In altre parole, la differenza prevista al periodo t (cioè Yacute (t) - Y ( t-1)) è uguale alla precedente differenza osservata (cioè Y (t-1) - Y (t-2)) meno una differenza ponderata dei due errori di previsione precedenti. Attenzione: questa forma del modello è piuttosto difficile da avviare all'inizio del periodo di stima. Si raccomanda la seguente convenzione: primo set Yacute (1) Y (1), che produce e (1) 0 (vale a dire imbrogliare un po ', e lasciare che il primo tempo uguale l'attuale prima osservazione), quindi anche impostare Yacute (2) Y (1), che produce e (2) Y (2) - Y (1), poi proseguire da questo punto utilizzando l'equazione di cui sopra. Ciò produrrà gli stessi valori stimati come formula basata su S e S se questi ultimi sono stati avviati utilizzando S (1) S (1) Y (1). Ancora una volta, è possibile utilizzare il foglio di calcolo il risolutore o qualsiasi algoritmo dei minimi quadrati non lineare per ottimizzare il valore di. Il valore ottimale di un modello LES montato questa serie da Statgraphics è 0,1607. Si noti che le previsioni a lungo termine del modello LES per questa serie storica sembrano tracciare la tendenza locale osservata negli ultimi 10 periodi. Inoltre, gli intervalli di confidenza per il modello LES allargano più velocemente di quelli del modello SES. Che cosa è meglio per questa particolare serie storica Ecco un rapporto di confronto modello per i modelli sopra descritti. Sembra che il modello di SES si comporta meglio rispetto ai modelli SMA, e il modello LES è vicino dietro. Se si sceglie SES o LES, in questo caso dipenderebbe dal fatto che si crede davvero che la serie ha una tendenza locale. Browns quadratica (cioè tripla) modello di livellamento. utilizza tre serie lisciata centrata in punti diversi nel tempo e estrapola una parabola attraverso i tre centri. Questo è raramente utilizzato nella pratica, però, dal momento vere tendenze di secondo grado sono rari e il modello è altamente instabile. Quale tipo di trend-estrapolazione è migliore: orizzontale, lineare, o evidenza empirica quadratica suggerisce che, se sono già stati adeguati i dati (se necessario) per l'inflazione, allora può essere imprudente per estrapolare lineare a breve termine (o, peggio, quadratica ) tendenze molto lontano nel futuro. Le tendenze evidenti oggi possono rallentare in futuro, dovuta a cause diverse quali obsolescenza dei prodotti, l'aumento della concorrenza, e flessioni cicliche o periodi di ripresa in un settore. Per questo motivo, semplice livellamento esponenziale spesso si comporta meglio out-of-sample che altrimenti potrebbero essere previsto, nonostante la sua ingenua estrapolazione di tendenza orizzontale. modifiche di tendenza smorzato del modello di livellamento esponenziale lineare sono spesso utilizzati in pratica per introdurre una nota di conservatorismo nelle sue proiezioni tendenziali - ahimè, questi ultimi non sono disponibili in Statgraphics. In linea di principio, è possibile calcolare intervalli di confidenza intorno previsioni a lungo termine prodotte da modelli di livellamento esponenziale, considerandole come casi speciali di modelli ARIMA. (Attenzione:. Non tutti i software fa questo in modo corretto, in particolare, una serie di popolari programmi automatici di previsione utilizzare metodi altamente sospetti per calcolare gli intervalli di confidenza per le previsioni di livellamento esponenziale.) La larghezza degli intervalli di confidenza dipende da (i) l'errore RMS della il modello, (ii) il valore di, (iii) il livello di smoothing (singola, doppia, o tripla) e (iv) il numero di periodi avanti si prevedono. In generale, gli intervalli distribuite più veloce come ottiene andor grande o come l'ordine di lisciatura aumenta da singolo a doppio triplicare. Rivedremo questo argomento quando discuteremo modelli ARIMA tardi nel data course. Smoothing rimuove variazione casuale e tendenze spettacoli e componenti cicliche inerenti alla raccolta dei dati presi nel corso del tempo è una qualche forma di variazione casuale. Esistono metodi per ridurre di annullare l'effetto dovuto alla variazione casuale. Una tecnica spesso utilizzata nel settore è levigante. Questa tecnica, se applicato correttamente, rivela più chiaramente la tendenza di fondo, stagionale e componenti cicliche. Ci sono due gruppi distinti di metodi di lisciatura Averaging Metodi esponenziali metodi di lisciatura medie prendere è il modo più semplice per lisciare i dati Per prima cosa studiare alcuni metodi di calcolo della media, come ad esempio la media semplice di tutti i dati passati. Un gestore di un magazzino vuole sapere quanto un fornitore tipico offre in 1000 unità in dollari. Heshe prende un campione di 12 fornitori, in modo casuale, ottenendo i seguenti risultati: La media calcolata o media dei dati 10. Il gestore decide di utilizzare questo come la stima delle spese di un fornitore tipico. Si tratta di una stima buona o cattiva quadratico medio errore è un modo per giudicare come un buon modello è Dobbiamo calcolare l'errore quadratico medio. Il vero errore importo speso meno l'importo stimato. L'errore al quadrato è l'errore di cui sopra, al quadrato. Il SSE è la somma degli errori quadratici. Il MSE è la media degli errori quadratici. MSE risulta per esempio I risultati sono: Error e errori al quadrato La stima 10 si pone la domanda: possiamo usare il mezzo per prevedere reddito se abbiamo il sospetto un trend Uno sguardo al grafico qui sotto mostra chiaramente che non dovremmo farlo. Media pesa tutte le osservazioni passate altrettanto In sintesi, si precisa che la media semplice o media di tutte le osservazioni del passato è solo una stima utile per la previsione quando non ci sono le tendenze. Se ci sono tendenze, utilizzare diverse stime che tengono il trend in considerazione. La media pesa tutte le osservazioni del passato allo stesso modo. Ad esempio, la media dei valori 3, 4, 5 è 4. Sappiamo, naturalmente, che in media è calcolata sommando tutti i valori e dividendo la somma per il numero di valori. Un altro modo di calcolare la media è aggiungendo ogni valore diviso per il numero di valori, o 33 43 53 1 1,3333 1,6667 4. Il moltiplicatore 13 è chiamato il peso. In generale: bar sum frac sinistra (frac destra) x1 sinistra (frac destra) x2,. ,, A sinistra (frac destra) xn. L'(a sinistra (frac destra)) sono i pesi e, ovviamente, essi sintetizzano a 1.Moving modelli medi e esponenziale Come primo passo per andare oltre i modelli medi, modelli random walk, e modelli di tendenza lineare, i modelli non stagionali e le tendenze possono essere estrapolati utilizzando un modello a media mobile o levigante. L'assunto di base dietro media e modelli di livellamento è che la serie temporale è localmente stazionario con una media lentamente variabile. Quindi, prendiamo una media mobile (locale) per stimare il valore corrente della media e poi utilizzarla come la previsione per il prossimo futuro. Questo può essere considerato come un compromesso tra il modello media e la deriva modello random walk-senza-. La stessa strategia può essere utilizzata per stimare e estrapolare una tendenza locale. Una media mobile è spesso chiamato una versione quotsmoothedquot della serie originale, perché la media a breve termine ha l'effetto di appianare i dossi nella serie originale. Regolando il grado di lisciatura (la larghezza della media mobile), possiamo sperare di colpire un qualche tipo di equilibrio ottimale tra le prestazioni dei modelli medi e random walk. Il tipo più semplice di modello di media è il. Semplice (equamente ponderate) Media mobile: Le previsioni per il valore di Y al tempo t1 che viene fatta al tempo t è pari alla media semplice dei più recenti osservazioni m: (Qui e altrove mi utilizzerà il simbolo 8220Y-hat8221 di stare per una previsione di serie temporali Y fatta quanto prima prima possibile da un dato modello.) Questa media è centrato periodo t - (m1) 2, il che implica che la stima della media locale tenderà a restare indietro il vero valore della media locale circa (m1) 2 periodi. Così, diciamo l'età media dei dati nella media mobile semplice (m1) 2 rispetto al periodo per il quale è calcolata la previsione: questa è la quantità di tempo per cui previsioni tenderanno a restare indietro ruotando punti nei dati . Ad esempio, se si sta una media degli ultimi 5 valori, le previsioni saranno circa 3 periodi in ritardo nel rispondere a punti di svolta. Si noti che se m1, il modello di media mobile semplice (SMA) è equivalente al modello random walk (senza crescita). Se m è molto grande (paragonabile alla lunghezza del periodo di stima), il modello SMA è equivalente al modello medio. Come con qualsiasi parametro di un modello di previsione, è consuetudine per regolare il valore di k per ottenere la migliore quotfitquot ai dati, cioè i più piccoli errori di previsione in media. Ecco un esempio di una serie che sembra mostrare fluttuazioni casuali intorno a una media lentamente variabile. Innanzitutto, proviamo per adattarsi con un modello casuale, che è equivalente a una media mobile semplice di 1 termine: Il modello random walk risponde molto velocemente alle variazioni della serie, ma così facendo raccoglie gran parte del quotnoisequot nel dati (le fluttuazioni casuali) e il quotsignalquot (media locale). Se invece cerchiamo una semplice media mobile di 5 termini, si ottiene un insieme più agevole dall'aspetto delle previsioni: Il 5-termine mobile semplice rese medie in modo significativo gli errori più piccoli rispetto al modello random walk in questo caso. L'età media dei dati di questa previsione è 3 ((51) 2), in modo che tende a ritardo punti di svolta da circa tre periodi. (Per esempio, una flessione sembra essersi verificato in periodo di 21, ma le previsioni non girare intorno fino a diversi periodi più tardi.) Si noti che le previsioni a lungo termine dal modello SMA sono una retta orizzontale, proprio come nel random walk modello. Pertanto, il modello SMA presuppone che vi sia alcuna tendenza nei dati. Tuttavia, mentre le previsioni del modello random walk sono semplicemente uguale all'ultimo valore osservato, le previsioni del modello di SMA sono pari ad una media ponderata dei valori ultimi. I limiti di confidenza calcolato dai Statgraphics per le previsioni a lungo termine della media mobile semplice non ottengono più ampio con l'aumento della previsione all'orizzonte. Questo ovviamente non è corretto Purtroppo, non vi è alcuna teoria statistica di fondo che ci dice come gli intervalli di confidenza deve ampliare per questo modello. Tuttavia, non è troppo difficile da calcolare le stime empiriche dei limiti di confidenza per le previsioni di più lungo orizzonte. Ad esempio, è possibile impostare un foglio di calcolo in cui il modello SMA sarebbe stato utilizzato per prevedere 2 passi avanti, 3 passi avanti, ecc all'interno del campione di dati storici. È quindi possibile calcolare le deviazioni standard campione degli errori in ogni orizzonte di previsione, e quindi la costruzione di intervalli di confidenza per le previsioni a lungo termine aggiungendo e sottraendo multipli della deviazione standard appropriato. Se cerchiamo una media del 9 termine semplice movimento, otteniamo le previsioni ancora più fluide e più di un effetto ritardo: L'età media è ora 5 punti ((91) 2). Se prendiamo una media mobile 19-termine, l'età media aumenta a 10: Si noti che, in effetti, le previsioni sono ora in ritardo punti di svolta da circa 10 periodi. Quale quantità di smoothing è meglio per questa serie Ecco una tabella che mette a confronto le loro statistiche di errore, anche compreso in media 3-termine: Modello C, la media mobile a 5-termine, i rendimenti il ​​valore più basso di RMSE da un piccolo margine su 3 - term e 9 termine medie, e le loro altre statistiche sono quasi identici. Così, tra i modelli con le statistiche di errore molto simili, possiamo scegliere se avremmo preferito un po 'più di risposta o un po' più scorrevolezza nelle previsioni. (Torna a inizio pagina.) Browns semplice esponenziale (media mobile esponenziale ponderata) Il modello a media mobile semplice di cui sopra ha la proprietà indesiderabile che tratta le ultime osservazioni k ugualmente e completamente ignora tutte le osservazioni che precedono. Intuitivamente, dati passati devono essere attualizzati in modo più graduale - per esempio, il più recente osservazione dovrebbe avere un peso poco più di 2 più recente, e la 2 più recente dovrebbe ottenere un po 'più peso che la 3 più recente, e presto. Il modello semplice di livellamento esponenziale (SES) realizza questo. Diamo 945 denotano una constantquot quotsmoothing (un numero compreso tra 0 e 1). Un modo per scrivere il modello è quello di definire una serie L che rappresenta il livello attuale (cioè il valore medio locale) della serie come stimato dai dati fino ad oggi. Il valore di L al momento t è calcolata in modo ricorsivo dal proprio valore precedente in questo modo: Così, il valore livellato corrente è una interpolazione tra il valore livellato precedente e l'osservazione corrente, dove 945 controlla la vicinanza del valore interpolato al più recente osservazione. Le previsioni per il prossimo periodo è semplicemente il valore livellato corrente: Equivalentemente, possiamo esprimere la prossima previsione direttamente in termini di precedenti previsioni e osservazioni precedenti, in una delle seguenti versioni equivalenti. Nella prima versione, la previsione è una interpolazione tra precedente meteorologiche e precedente osservazione: Nella seconda versione, la prossima previsione è ottenuta regolando la previsione precedente nella direzione dell'errore precedente di una quantità frazionaria 945. è l'errore al tempo t. Nella terza versione, la previsione è di un (cioè scontato) media mobile esponenziale ponderata con fattore di sconto 1- 945: La versione di interpolazione della formula di previsione è il più semplice da usare se si implementa il modello su un foglio di calcolo: si inserisce in un singola cellula e contiene i riferimenti di cella che puntano alla previsione precedente, l'osservazione precedente, e la cella in cui è memorizzato il valore di 945. Si noti che se 945 1, il modello SES è equivalente ad un modello random walk (senza crescita). Se 945 0, il modello SES è equivalente al modello medio, assumendo che il primo valore livellato è impostata uguale alla media. (Torna a inizio pagina). L'età media dei dati nelle previsioni semplice esponenziale-levigante è di 1 945 relativo al periodo per il quale è calcolata la previsione. (Questo non dovrebbe essere ovvio, ma può essere facilmente dimostrare valutando una serie infinita.) Quindi, la semplice previsione media mobile tende a restare indietro punti di svolta da circa 1 945 periodi. For example, when 945 0.5 the lag is 2 periods when 945 0.2 the lag is 5 periods when 945 0.1 the lag is 10 periods, and so on. For a given average age (i. e. amount of lag), the simple exponential smoothing (SES) forecast is somewhat superior to the simple moving average (SMA) forecast because it places relatively more weight on the most recent observation --i. e. it is slightly more quotresponsivequot to changes occuring in the recent past. For example, an SMA model with 9 terms and an SES model with 945 0.2 both have an average age of 5 for the data in their forecasts, but the SES model puts more weight on the last 3 values than does the SMA model and at the same time it doesn8217t entirely 8220forget8221 about values more than 9 periods old, as shown in this chart: Another important advantage of the SES model over the SMA model is that the SES model uses a smoothing parameter which is continuously variable, so it can easily optimized by using a quotsolverquot algorithm to minimize the mean squared error. The optimal value of 945 in the SES model for this series turns out to be 0.2961, as shown here: The average age of the data in this forecast is 10.2961 3.4 periods, which is similar to that of a 6-term simple moving average. The long-term forecasts from the SES model are a horizontal straight line . as in the SMA model and the random walk model without growth. However, note that the confidence intervals computed by Statgraphics now diverge in a reasonable-looking fashion, and that they are substantially narrower than the confidence intervals for the random walk model. The SES model assumes that the series is somewhat quotmore predictablequot than does the random walk model. An SES model is actually a special case of an ARIMA model. so the statistical theory of ARIMA models provides a sound basis for calculating confidence intervals for the SES model. In particular, an SES model is an ARIMA model with one nonseasonal difference, an MA(1) term, and no constant term . otherwise known as an quotARIMA(0,1,1) model without constantquot. The MA(1) coefficient in the ARIMA model corresponds to the quantity 1- 945 in the SES model. For example, if you fit an ARIMA(0,1,1) model without constant to the series analyzed here, the estimated MA(1) coefficient turns out to be 0.7029, which is almost exactly one minus 0.2961. It is possible to add the assumption of a non-zero constant linear trend to an SES model. To do this, just specify an ARIMA model with one nonseasonal difference and an MA(1) term with a constant, i. e. an ARIMA(0,1,1) model with constant. The long-term forecasts will then have a trend which is equal to the average trend observed over the entire estimation period. You cannot do this in conjunction with seasonal adjustment, because the seasonal adjustment options are disabled when the model type is set to ARIMA. However, you can add a constant long-term exponential trend to a simple exponential smoothing model (with or without seasonal adjustment) by using the inflation adjustment option in the Forecasting procedure. The appropriate quotinflationquot (percentage growth) rate per period can be estimated as the slope coefficient in a linear trend model fitted to the data in conjunction with a natural logarithm transformation, or it can be based on other, independent information concerning long-term growth prospects. (Return to top of page.) Browns Linear (i. e. double) Exponential Smoothing The SMA models and SES models assume that there is no trend of any kind in the data (which is usually OK or at least not-too-bad for 1-step-ahead forecasts when the data is relatively noisy), and they can be modified to incorporate a constant linear trend as shown above. What about short-term trends If a series displays a varying rate of growth or a cyclical pattern that stands out clearly against the noise, and if there is a need to forecast more than 1 period ahead, then estimation of a local trend might also be an issue. The simple exponential smoothing model can be generalized to obtain a linear exponential smoothing (LES) model that computes local estimates of both level and trend. The simplest time-varying trend model is Browns linear exponential smoothing model, which uses two different smoothed series that are centered at different points in time. The forecasting formula is based on an extrapolation of a line through the two centers. (A more sophisticated version of this model, Holt8217s, is discussed below.) The algebraic form of Brown8217s linear exponential smoothing model, like that of the simple exponential smoothing model, can be expressed in a number of different but equivalent forms. The quotstandardquot form of this model is usually expressed as follows: Let S denote the singly-smoothed series obtained by applying simple exponential smoothing to series Y. That is, the value of S at period t is given by: (Recall that, under simple exponential smoothing, this would be the forecast for Y at period t1.) Then let Squot denote the doubly-smoothed series obtained by applying simple exponential smoothing (using the same 945 ) to series S: Finally, the forecast for Y tk . for any kgt1, is given by: This yields e 1 0 (i. e. cheat a bit, and let the first forecast equal the actual first observation), and e 2 Y 2 8211 Y 1 . after which forecasts are generated using the equation above. This yields the same fitted values as the formula based on S and S if the latter were started up using S 1 S 1 Y 1 . This version of the model is used on the next page that illustrates a combination of exponential smoothing with seasonal adjustment. Holt8217s Linear Exponential Smoothing Brown8217s LES model computes local estimates of level and trend by smoothing the recent data, but the fact that it does so with a single smoothing parameter places a constraint on the data patterns that it is able to fit: the level and trend are not allowed to vary at independent rates. Holt8217s LES model addresses this issue by including two smoothing constants, one for the level and one for the trend. At any time t, as in Brown8217s model, the there is an estimate L t of the local level and an estimate T t of the local trend. Here they are computed recursively from the value of Y observed at time t and the previous estimates of the level and trend by two equations that apply exponential smoothing to them separately. If the estimated level and trend at time t-1 are L t82091 and T t-1 . respectively, then the forecast for Y tshy that would have been made at time t-1 is equal to L t-1 T t-1 . When the actual value is observed, the updated estimate of the level is computed recursively by interpolating between Y tshy and its forecast, L t-1 T t-1, using weights of 945 and 1- 945. The change in the estimated level, namely L t 8209 L t82091 . can be interpreted as a noisy measurement of the trend at time t. The updated estimate of the trend is then computed recursively by interpolating between L t 8209 L t82091 and the previous estimate of the trend, T t-1 . using weights of 946 and 1-946: The interpretation of the trend-smoothing constant 946 is analogous to that of the level-smoothing constant 945. Models with small values of 946 assume that the trend changes only very slowly over time, while models with larger 946 assume that it is changing more rapidly. A model with a large 946 believes that the distant future is very uncertain, because errors in trend-estimation become quite important when forecasting more than one period ahead. (Return to top of page.) The smoothing constants 945 and 946 can be estimated in the usual way by minimizing the mean squared error of the 1-step-ahead forecasts. When this done in Statgraphics, the estimates turn out to be 945 0.3048 and 946 0.008 . The very small value of 946 means that the model assumes very little change in the trend from one period to the next, so basically this model is trying to estimate a long-term trend. By analogy with the notion of the average age of the data that is used in estimating the local level of the series, the average age of the data that is used in estimating the local trend is proportional to 1 946, although not exactly equal to it. In this case that turns out to be 10.006 125. This isn8217t a very precise number inasmuch as the accuracy of the estimate of 946 isn8217t really 3 decimal places, but it is of the same general order of magnitude as the sample size of 100, so this model is averaging over quite a lot of history in estimating the trend. The forecast plot below shows that the LES model estimates a slightly larger local trend at the end of the series than the constant trend estimated in the SEStrend model. Also, the estimated value of 945 is almost identical to the one obtained by fitting the SES model with or without trend, so this is almost the same model. Now, do these look like reasonable forecasts for a model that is supposed to be estimating a local trend If you 8220eyeball8221 this plot, it looks as though the local trend has turned downward at the end of the series What has happened The parameters of this model have been estimated by minimizing the squared error of 1-step-ahead forecasts, not longer-term forecasts, in which case the trend doesn8217t make a lot of difference. If all you are looking at are 1-step-ahead errors, you are not seeing the bigger picture of trends over (say) 10 or 20 periods. In order to get this model more in tune with our eyeball extrapolation of the data, we can manually adjust the trend-smoothing constant so that it uses a shorter baseline for trend estimation. For example, if we choose to set 946 0.1, then the average age of the data used in estimating the local trend is 10 periods, which means that we are averaging the trend over that last 20 periods or so. Here8217s what the forecast plot looks like if we set 946 0.1 while keeping 945 0.3. This looks intuitively reasonable for this series, although it is probably dangerous to extrapolate this trend any more than 10 periods in the future. What about the error stats Here is a model comparison for the two models shown above as well as three SES models. The optimal value of 945.for the SES model is approximately 0.3, but similar results (with slightly more or less responsiveness, respectively) are obtained with 0.5 and 0.2. (A) Holts linear exp. smoothing with alpha 0.3048 and beta 0.008 (B) Holts linear exp. smoothing with alpha 0.3 and beta 0.1 (C) Simple exponential smoothing with alpha 0.5 (D) Simple exponential smoothing with alpha 0.3 (E) Simple exponential smoothing with alpha 0.2 Their stats are nearly identical, so we really can8217t make the choice on the basis of 1-step-ahead forecast errors within the data sample. We have to fall back on other considerations. If we strongly believe that it makes sense to base the current trend estimate on what has happened over the last 20 periods or so, we can make a case for the LES model with 945 0.3 and 946 0.1. If we want to be agnostic about whether there is a local trend, then one of the SES models might be easier to explain and would also give more middle-of-the-road forecasts for the next 5 or 10 periods. (Return to top of page.) Which type of trend-extrapolation is best: horizontal or linear Empirical evidence suggests that, if the data have already been adjusted (if necessary) for inflation, then it may be imprudent to extrapolate short-term linear trends very far into the future. Trends evident today may slacken in the future due to varied causes such as product obsolescence, increased competition, and cyclical downturns or upturns in an industry. For this reason, simple exponential smoothing often performs better out-of-sample than might otherwise be expected, despite its quotnaivequot horizontal trend extrapolation. Damped trend modifications of the linear exponential smoothing model are also often used in practice to introduce a note of conservatism into its trend projections. The damped-trend LES model can be implemented as a special case of an ARIMA model, in particular, an ARIMA(1,1,2) model. It is possible to calculate confidence intervals around long-term forecasts produced by exponential smoothing models, by considering them as special cases of ARIMA models. (Beware: not all software calculates confidence intervals for these models correctly.) The width of the confidence intervals depends on (i) the RMS error of the model, (ii) the type of smoothing (simple or linear) (iii) the value(s) of the smoothing constant(s) and (iv) the number of periods ahead you are forecasting. In general, the intervals spread out faster as 945 gets larger in the SES model and they spread out much faster when linear rather than simple smoothing is used. This topic is discussed further in the ARIMA models section of the notes. (Return to top of page.)

No comments:

Post a Comment