Tuesday 17 January 2017

Moving Average To Remove Saisonalität

Spreadsheet-Implementierung der saisonalen Anpassung und exponentieller Glättung Es ist einfach, saisonale Anpassung durchzuführen und exponentielle Glättungsmodelle mit Excel anzupassen. Die unten aufgeführten Bildschirmbilder und Diagramme werden einer Tabellenkalkulation entnommen, die eine multiplikative saisonale Anpassung und eine lineare Exponentialglättung auf den folgenden vierteljährlichen Verkaufsdaten von Outboard Marine darstellt: Um eine Kopie der Tabellenkalkulation selbst zu erhalten, klicken Sie hier. Die Version der linearen exponentiellen Glättung, die hier für Demonstrationszwecke verwendet wird, ist die Brown8217s-Version, nur weil sie mit einer einzigen Spalte von Formeln implementiert werden kann und es nur eine Glättungskonstante gibt, die optimiert werden soll. In der Regel ist es besser, Holt8217s Version, die separate Glättungskonstanten für Ebene und Trend hat. Der Prognoseprozess verläuft wie folgt: (i) Die Daten werden saisonbereinigt (ii) sodann für die saisonbereinigten Daten über lineare exponentielle Glättung Prognosen erstellt und (iii) schließlich werden die saisonbereinigten Prognosen zur Erzielung von Prognosen für die ursprüngliche Serie herangezogen . Der saisonale Anpassungsprozess wird in den Spalten D bis G durchgeführt. Der erste Schritt in der Saisonbereinigung besteht darin, einen zentrierten gleitenden Durchschnitt (hier in Spalte D) zu berechnen. Dies kann erreicht werden, indem der Durchschnitt von zwei einjährigen Durchschnittswerten, die um eine Periode relativ zueinander versetzt sind, genommen wird. (Eine Kombination von zwei Offset-Durchschnittswerten anstatt eines einzigen Mittels wird für die Zentrierung benötigt, wenn die Anzahl der Jahreszeiten gleich ist.) Der nächste Schritt besteht darin, das Verhältnis zum gleitenden Durchschnitt zu berechnen. Wobei die ursprünglichen Daten durch den gleitenden Durchschnitt in jeder Periode dividiert werden, was hier in Spalte E durchgeführt wird. (Dies wird auch Quottrend-Cyclequot-Komponente des Musters genannt, sofern Trend - und Konjunktur-Effekte als all das betrachtet werden können Bleibt nach einer Durchschnittsberechnung über ein ganzes Jahr im Wert von Daten bestehen. Natürlich können die monatlichen Veränderungen, die nicht saisonal bedingt sind, durch viele andere Faktoren bestimmt werden, aber der 12-Monatsdurchschnitt glättet sie weitgehend Wird der geschätzte saisonale Index für jede Jahreszeit berechnet, indem zuerst alle Verhältnisse für die jeweilige Jahreszeit gemittelt werden, was in den Zellen G3-G6 unter Verwendung einer AVERAGEIF-Formel erfolgt. Die Durchschnittsverhältnisse werden dann neu skaliert, so daß sie auf das genau 100-fache der Anzahl der Perioden in einer Jahreszeit, oder 400 in diesem Fall, das in den Zellen H3-H6 erfolgt, summieren. Unten in der Spalte F werden VLOOKUP-Formeln verwendet, um den entsprechenden saisonalen Indexwert in jede Zeile der Datentabelle einzufügen, entsprechend dem Viertel des Jahres, das es repräsentiert. Der zentrierte gleitende Durchschnitt und die saisonbereinigten Daten enden wie folgt: Beachten Sie, dass der gleitende Durchschnitt typischerweise wie eine glattere Version der saisonbereinigten Serie aussieht und an beiden Enden kürzer ist. Ein weiteres Arbeitsblatt in derselben Excel-Datei zeigt die Anwendung des linearen exponentiellen Glättungsmodells auf die saisonbereinigten Daten beginnend in Spalte G. Über der Prognosespalte (hier in Zelle H9) wird ein Wert für die Glättungskonstante (alpha) eingetragen Zur Vereinfachung wird ihm der Bereichsname quotAlpha. quot zugewiesen (Der Name wird mit dem Befehl "InSert Name Createquot" zugewiesen.) Das LES-Modell wird initialisiert, indem die ersten beiden Prognosen gleich dem ersten Istwert der saisonbereinigten Serie gesetzt werden. Die hier verwendete Formel für die LES-Prognose ist die rekursive Einzelformel des Brown8217s-Modells: Diese Formel wird in der Zelle entsprechend der dritten Periode (hier Zelle H15) eingegeben und von dort nach unten kopiert. Beachten Sie, dass sich die LES-Prognose für den aktuellen Zeitraum auf die beiden vorherigen Beobachtungen und die beiden vorherigen Prognosefehler sowie auf den Wert von alpha bezieht. Somit bezieht sich die Prognoseformel in Zeile 15 nur auf Daten, die in Zeile 14 und früher verfügbar waren. (Natürlich könnten wir statt der linearen exponentiellen Glättung einfach statt der linearen exponentiellen Glättung verwenden, könnten wir stattdessen die SES-Formel ersetzen. Wir könnten auch Holt8217s anstelle von Brown8217s LES-Modell verwenden, was zwei weitere Spalten von Formeln erfordern würde, um das Niveau und den Trend zu berechnen Die in der Prognose verwendet werden.) Die Fehler werden in der nächsten Spalte (hier Spalte J) durch Subtrahieren der Prognosen von den Istwerten berechnet. Der Quadratwurzel-Quadratfehler wird als Quadratwurzel der Varianz der Fehler plus dem Quadrat des Mittelwerts berechnet. (Das ergibt sich aus der mathematischen Identität: MSE VARIANCE (Fehler) (AVERAGE (Fehler)). 2) Bei der Berechnung des Mittelwertes und der Varianz der Fehler in dieser Formel sind die ersten beiden Perioden ausgeschlossen, da das Modell nicht tatsächlich mit der Prognose beginnt Die dritte Periode (Zeile 15 auf der Kalkulationstabelle). Der optimale Wert von alpha kann entweder durch manuelles Ändern von alpha gefunden werden, bis das minimale RMSE gefunden wird, oder Sie können das quotSolverquot verwenden, um eine genaue Minimierung durchzuführen. Der Wert von alpha, den der Solver gefunden hat, wird hier angezeigt (alpha0.471). Es ist in der Regel eine gute Idee, die Fehler des Modells (in transformierten Einheiten) zu zeichnen und ihre Autokorrelationen zu berechnen und zu zeichnen, bis zu einer Saison. Hier ist eine Zeitreihenfolge der (saisonbereinigten) Fehler: Die Fehlerautokorrelationen werden mit Hilfe der CORREL () - Funktion berechnet, um die Korrelationen der Fehler selbst mit einer oder mehreren Perioden zu berechnen - Einzelheiten sind im Kalkulationsblatt dargestellt . Hier ist ein Diagramm der Autokorrelationen der Fehler bei den ersten fünf Verzögerungen: Die Autokorrelationen bei den Verzögerungen 1 bis 3 sind sehr nahe bei Null, aber die Spitze bei Verzögerung 4 (deren Wert 0,35 ist) ist etwas mühsam Saisonale Anpassungsprozess nicht vollständig erfolgreich war. Allerdings ist es eigentlich nur marginal signifikant. 95 Signifikanzbanden zum Testen, ob Autokorrelationen signifikant von Null verschieden sind, sind ungefähr plus-oder-minus 2 SQRT (n-k), wobei n die Stichprobengröße und k die Verzögerung ist. Hier ist n gleich 38 und k variiert von 1 bis 5, so daß die Quadratwurzel von - n-minus-k für alle von etwa 6 ist, und daher sind die Grenzen für das Testen der statistischen Signifikanz von Abweichungen von Null grob plus - Oder-minus 2 6 oder 0,33. Wenn Sie den Wert von alpha von Hand in diesem Excel-Modell variieren, können Sie den Effekt auf die Zeitreihen und Autokorrelationsdiagramme der Fehler sowie auf den Root-mean-squared-Fehler beobachten, der nachfolgend dargestellt wird. Am Ende der Kalkulationstabelle wird die Prognoseformel quasi in die Zukunft gestartet, indem lediglich Prognosen für tatsächliche Werte an dem Punkt ausgetauscht werden, an dem die tatsächlichen Daten ablaufen - d. h. Wo die Zukunft beginnt. (Mit anderen Worten, in jeder Zelle, in der ein zukünftiger Datenwert auftreten würde, wird eine Zellreferenz eingefügt, die auf die Prognose für diese Periode hinweist.) Alle anderen Formeln werden einfach von oben nach unten kopiert: Beachten Sie, dass die Fehler für Prognosen von Die Zukunft werden alle berechnet, um Null zu sein. Dies bedeutet nicht, dass die tatsächlichen Fehler null sein werden, sondern lediglich die Tatsache, dass wir für die Vorhersage davon ausgehen, dass die zukünftigen Daten den Prognosen im Durchschnitt entsprechen werden. Die daraus resultierenden LES-Prognosen für die saisonbereinigten Daten sehen wie folgt aus: Mit diesem für α-Periodenprognosen optimalen Wert von alpha ist der prognostizierte Trend leicht nach oben, was auf den lokalen Trend in den letzten 2 Jahren zurückzuführen ist oder so. Für andere Werte von alpha könnte eine sehr unterschiedliche Trendprojektion erhalten werden. Es ist normalerweise eine gute Idee, zu sehen, was mit der langfristigen Trendprojektion geschieht, wenn Alpha variiert wird, weil der Wert, der für kurzfristige Prognosen am besten ist, nicht notwendigerweise der beste Wert für die Vorhersage der weiter entfernten Zukunft sein wird. Dies ist beispielsweise das Ergebnis, das erhalten wird, wenn der Wert von alpha manuell auf 0,25 gesetzt wird: Der projizierte Langzeittrend ist jetzt eher negativ als positiv Mit einem kleineren Wert von alpha setzt das Modell mehr Gewicht auf ältere Daten Seine Einschätzung des aktuellen Niveaus und Tendenz und seine langfristigen Prognosen spiegeln den in den letzten 5 Jahren beobachteten Abwärtstrend anstatt den jüngsten Aufwärtstrend wider. Dieses Diagramm zeigt auch deutlich, wie das Modell mit einem kleineren Wert von alpha langsamer ist, um auf quotturning pointsquot in den Daten zu antworten und daher tendiert, einen Fehler des gleichen Vorzeichens für viele Perioden in einer Reihe zu machen. Die Prognosefehler von 1-Schritt-Vorhersage sind im Mittel größer als die, die zuvor erhalten wurden (RMSE von 34,4 statt 27,4) und stark positiv autokorreliert. Die Lag-1-Autokorrelation von 0,56 übersteigt den oben berechneten Wert von 0,33 für eine statistisch signifikante Abweichung von Null deutlich. Als Alternative zum Abkürzen des Wertes von Alpha, um mehr Konservatismus in Langzeitprognosen einzuführen, wird manchmal ein Quottrend-Dämpfungsquotfaktor dem Modell hinzugefügt, um die projizierte Tendenz nach einigen Perioden abflachen zu lassen. Der letzte Schritt beim Erstellen des Prognosemodells besteht darin, die LES-Prognosen durch Multiplikation mit den entsprechenden saisonalen Indizes zu veranschaulichen. Somit sind die reseasonalisierten Prognosen in Spalte I einfach das Produkt der saisonalen Indizes in Spalte F und der saisonbereinigten LES-Prognosen in Spalte H. Es ist relativ einfach, Konfidenzintervalle für einstufige Prognosen dieses Modells zu berechnen: Erstens Berechnen Sie den RMSE (root-mean-squared Fehler, der nur die Quadratwurzel der MSE ist) und berechnen Sie dann ein Konfidenzintervall für die saisonbereinigte Prognose durch Addition und Subtraktion zweimal des RMSE. (Im Allgemeinen ist ein 95-Konfidenzintervall für eine Ein-Perioden-Vorausprognose ungefähr gleich der Punktvorhersage plus-oder-minus-zweimal der geschätzten Standardabweichung der Prognosefehler, vorausgesetzt, die Fehlerverteilung ist annähernd normal und die Stichprobengröße Ist groß genug, sagen wir, 20 oder mehr Hier ist die RMSE anstelle der Standardabweichung der Fehler die beste Schätzung der Standardabweichung der zukünftigen Prognosefehler, weil sie auch die Zufallsvariationen berücksichtigt.) Die Vertrauensgrenzen Für die saisonbereinigte Prognose werden dann reseasonalisiert. Zusammen mit der Prognose, durch Multiplikation mit den entsprechenden saisonalen Indizes. In diesem Fall ist die RMSE gleich 27,4 und die saisonbereinigte Prognose für die erste künftige Periode (Dez-93) beträgt 273,2. So dass das saisonbereinigte 95-Konfidenzintervall von 273,2-227,4 218,4 auf 273,2227,4 328,0 liegt. Das Multiplizieren dieser Limits durch Decembers saisonalen Index von 68,61. Erhalten wir niedrigere und obere Konfidenzgrenzen von 149,8 und 225,0 um die Dez-93-Punktprognose von 187,4. Die Vertrauensgrenzen für Prognosen, die länger als eine Periode vorangehen, werden sich in der Regel aufgrund der Unsicherheit über das Niveau und den Trend sowie die saisonalen Faktoren erweitern, da der Prognosehorizont zunimmt, aber es ist schwierig, diese im Allgemeinen nach analytischen Methoden zu berechnen. (Die geeignete Methode zur Berechnung der Vertrauensgrenzen für die LES-Prognose ist die Verwendung der ARIMA-Theorie, aber auch die Unsicherheit in den saisonalen Indizes ist eine andere.) Wenn Sie ein realistisches Konfidenzintervall für eine Prognose über mehrere Perioden bevorzugen, Fehler zu berücksichtigen, ist Ihre beste Wette, empirische Methoden zu verwenden: Zum Beispiel, um ein Vertrauensintervall für eine 2-Schritt-Vorausprognose zu erhalten, könnten Sie eine weitere Spalte auf der Kalkulationstabelle erstellen, um eine 2-Schritt-Voraus-Prognose für jeden Zeitraum zu berechnen Durch Booten der Ein-Schritt-Voraus-Prognose). Dann berechnen Sie die RMSE der 2-Schritt-Voraus-Prognose Fehler und verwenden Sie diese als Grundlage für ein 2-Schritt-Ahead-Konfidenzintervall.8216Tis Die Saisonalität Ihrer Metriken Ein paar Beiträge zurück, untersuchte ich eine einfache Technik für die Verwendung eines exponentiellen bewegen (EMA) auf Ihre Zeitreihenmetriken. Dies hat den Vorteil der Glättung der Metriken bei gleichzeitiger Beibehaltung einer 8220memory8221 aller vorherigen Werte der Metrik, die vorher kam. Es hat auch den Vorteil, dass es leichter aktualisiert werden kann, wenn neue Werte für Ihre Metriken verfügbar werden. Dieses Mal möchte ich Ihnen zeigen, eine Technik, um eine andere gemeinsame Zeitreihe Problem zu beheben: Saisonalität. Yeah, Ihre Metriken sind im Januar, aber ist, dass die üblichen Post-Urlaub Umsatz Einbruch oder ist es der Beginn eines wahren Abwärtstrend, die Sie brauchen, um ein Auge auf den Artikel zu veranschaulichen eine schnelle und einfache Art und Weise zu de-Saisonalisierung Ihrer Daten. Let8217s Arbeit durch ein Beispiel Schritt für Schritt: Stellen Sie sich vor, wir arbeiten bei einem Software-Unternehmen, wo das Unternehmensebene Produkt hat eine ziemlich lange Verkaufszyklus, und unsere Metrik ist tatsächlich Rohumwandlungen während eines Quartals. Wenn Sie sich auf Ihre Umsatz-Umsatz-Metriken in der oben genannten Chart, wie geht es Ihnen in letzter Zeit Besser als 2010 So gut wie 2011 Here8217s die Rohdaten: Schritt 1: Sammeln Sie Metriken Data Go Back Mindestens 3 Full-Cycle-Perioden Für die meisten Leute, Das bedeutet vierteljährliche oder monatliche Daten, die drei Jahre zurückliegen. Ja, Sie können wöchentliche oder tägliche Daten verwenden, obwohl you8217ll normalerweise wollen, um diese Daten zu glätten (cha-ching eine weitere große Verwendung für den exponentiellen gleitenden Durchschnitt). Und es needn8217t im Laufe eines ganzen Jahres sein, wenn die 8220seasons8221 Ihre Daten durch isn8217t gemessen durch die Kalendermonate 8212 so, wenn you8217re Blick auf Tag-der-Woche Daten, sagen wir, zu vergleichen, wie Ihre Kunden am Montag zu handeln Versus Donnerstag, dann eine gute 8-12 Wochen Daten wäre ein kluges Minimum. Schritt 2: Vergleiche Time-Periods wie Time-Periods Zum Beispiel, betrachten Sie alle Januar oder alle dienstags, und berechnen Sie einen Durchschnitt. Hier verwende ich ein einfaches Mittel statt der EMA. Da die EMA so konzipiert ist, dass sie für die Zeitreihenperiode verwendbar ist, die sequentiell verglichen wird 8212, die einen Februar mit dem Januar verglichen hat, der vor ihm 8212 kam, und wir dies nicht eher tun, können wir die Daten als reine Daten behandeln und unser Endziel ist es Extrahieren die saisonalen Zeitreihen. Schritt 3: Normalisierung Vergleichen Sie alle diese Mittelwerte miteinander und teilen Sie jeden der Mittelwerte mit dem Mittelwert der Durchschnittswerte auf, was im Vergleich zu dem Normalwert, der als 8220normalization bezeichnet wird, im Durchschnitt einen saisonbereinigten Faktor ergibt Ist, wie wir vergleichen 8220apples zu apples8221 über mehrere Jahre und im Zusammenhang mit der gesamten Saison Wirkung. Schritt 4: Dividieren Sie jeden ursprünglichen Datenpunkt durch seinen saisonbereinigten Faktor Dies gibt Ihnen einen effektiven Wert für diese Metrik mit der saisonalen Komponente entfernt. Schritt 5: Auslosung der Schlussfolgerungen Betrachten Sie diese neuen de-saisonalisierten Daten und ziehen Sie Schlussfolgerungen, falls vorhanden, aus. Nun, da wir die Saisonalität der Verkäufe subtrahiert haben, sind Ihre Schlussfolgerungen unterschiedlich Angesichts der roten, de-seasoned Daten, sieht es sicher aus wie die 2012 niedrig ist sogar niedriger als das Ende des Jahres 2010, und die 2012 isn8217t fast so hoch wie Im Jahr 2011. Dies sollte dazu führen, dass einige Bestürzung in der nächsten Verkaufstreffen Natürlich gibt es eine zillion Vorbehalte hier. Ist Ihre Daten auch saisonale an erster Stelle Blick auf die blaue Linie, das Beste, was wir sagen können, ist 8220maybe8221 8212 it8217d toll, mehr Daten zu haben. Vielleicht eine monatliche Aufschlüsselung der Daten anstelle von vierteljährlich. Ein weiterer Vorbehalt könnte zyklisch sein 8212, wenn der Konjunkturzyklus Ihren Verkaufszyklus dominiert, dann kann es leicht die saisonale Komponente 8212 schwellen, aber wenn that8217s der Fall, warum die niedrigere niedrig im 2012 Verkäufe So, meine Frage in diesem Monat: wenn Sie Ihre Metriken betrachten , Erklären Sie Saisonalität Oder schauen Sie gerade, um zu sehen, wenn die Zahlen 8220up8221 im letzten Report sind Sie konnten eine Schlüsseleinsicht vermissen. Einige Meinungen in diesem Artikel können die eines Gast-Autor und nicht unbedingt Marketing Land sein. Hier sind die Autoren der Autoren aufgelistet. Über den Autor John Quarto-vonTivadar ist einer der Erfinder der Persuasion Architektur und regelmäßig bekämpft Innumeracy unter den Vermarktern in seinem beliebten Math for Marketers Serie. Johns 2008 Bestseller, Always Be Testing, geschrieben mit Geschäftspartner Bryan Eisenberg, wurde die Standard-Referenz für die Umwandlung Optimierung durch Testen seit seiner Veröffentlichung und wurde für die Grundlage der beiden akademischen Kursarbeit sowie Corporate Training verwendet. In Verbindung stehende Artikel


No comments:

Post a Comment