Thursday, 18 May 2017

Moving Average Autokorrelationsmatrix


Autokorrelationsfunktion Beachten Sie, dass 0 die Varianz des stochastischen Prozesses ist. Die Autokovarianzfunktion bei lag k. Für k 0, der Zeitreihe wird durch die Autokorrelationsfunktion (ACF) bei Verzögerung k definiert. Für k 0, der Zeitreihe ist definiert durch Die Varianz der Zeitreihe ist r 0. Ein Plot von r k gegen k ist als Korrelogramm bekannt. Überwachung . Die oben angegebene Definition der Autokovarianz unterscheidet sich von der üblichen Definition der Kovarianz zwischen 1. , Y n-k und k 1. , Y n in zweierlei Hinsicht: (1) wir teilen durch n anstelle von nk und wir subtrahieren den gesamten Mittelwert anstatt der Mittel von 1. , Y n-k und k 1. , Y n. Für Werte von n, die in bezug auf k groß sind. Der Unterschied wird klein sein. Beispiel 1 . Berechnen Sie s 2 und r 2 für die Daten im Bereich B4: B19 von Abbildung 1. Abbildung 1 ACF bei Verzögerung 2 Die Formeln zur Berechnung von s 2 und r 2 unter Verwendung der üblichen COVARIANCE. S - und CORREL-Funktionen sind in den Zellen G4 und G5 dargestellt. Die Formeln für s 0. S 2 und r 2 aus Definition 2 sind in den Zellen G8, G11 und G12 (zusammen mit einer alternativen Formel in G13) gezeigt. Beachten Sie, dass die Werte für s 2 in den Zellen E4 und E11 nicht zu unterschiedlich sind, ebenso wie die Werte für r 2, die in den Zellen E5 und E12 angezeigt werden, je größer die Probe ist, desto wahrscheinlicher sind diese Werte ähnlich Real Statistics Function. Das reale Statistik-Ressourcenpaket liefert die folgenden Funktionen: ACF (R1, k) der ACF-Wert bei Verzögerung k für die Zeitreihen im Bereich R1 ACVF (R1, k) die Autokovarianz bei Verzögerung k für die Zeitreihen im Bereich R1 Beachten Sie, dass ACF (R1, k) ist gleichbedeutend mit SUMPRODUCT (OFFSET (R1,0,0, COUNT (R1) - k) - AVERAGE (R1), OFFSET (R1, k, 0, COUNT (R1) - k) - AVERAGE (R1 )) DEVSQ (R1) Beobachtung. Es gibt theoretische Vorteile für die Verwendung von Division durch n anstelle von nk in der Definition von s k. Dass die Kovarianz - und Korrelationsmatrizen immer definitiv nicht negativ sein werden (siehe Positive Definitivmatrizen). Überwachung . Auch wenn sich die Definition der Autokorrelation etwas von der Korrelation unterscheidet, nimmt k (oder r k) immer noch einen Wert zwischen -1 und 1 ein, wie wir in der Eigenschaft 2 sehen. Beispiel 2. Bestimmen Sie die ACF für die Verzögerung 1 bis 10 für die Dow Jones-Schlussmittelwerte für den Monat Oktober 2015, wie in den Spalten A und B von 2 gezeigt und konstruieren Sie das entsprechende Korrelogramm. Die Ergebnisse sind in Abbildung 2 dargestellt. Die Werte in Spalte E werden berechnet, indem die Formel ACF (B4: B25, D5) in Zelle E5, Hervorhebung des Bereichs E5: E14 und Drücken von Strg-D gesetzt wird. Abbildung 2 ACF und Correlogram Wie aus den Werten in Spalte E oder dem Diagramm ersichtlich ist, fallen die ACF-Werte langsam auf Null ab. Dies ist typisch für einen autoregressiven Prozess. Überwachung . Eine Faustregel besteht darin, den obigen Vorgang für die Verzögerung 1 bis n 3 oder n 4 durchzuführen, was für die obigen Daten 224 6 oder 223 beträgt. 7 Unser Ziel ist es zu sehen, ob zu diesem Zeitpunkt das ACF signifikant ist (dh statistisch anders ist Von null). Wir können dies tun, indem wir die folgende Eigenschaft verwenden. Eigenschaft 3 (Bartlett): In großen Stichproben, wenn eine Zeitreihe der Größe n rein zufällig ist, dann für alle k Beispiel 3. Bestimmen Sie, ob der ACF bei Verzögerung 7 für die Daten aus Beispiel 2 signifikant ist. Wie wir aus Abbildung 3 sehen können, ist der kritische Wert für den Test in Eigenschaft 3 .417866. Da r 7 .303809 lt .417866, schließen wir, dass sich nicht signifikant von Null unterscheidet. Abbildung 3 Bartletts Test Beachten Sie, dass Werte von k bis 5 signifikant sind und die höher als 5 nicht signifikant sind. Eine statistisch leistungsfähigere Version von Eigenschaft 4, besonders für kleinere Proben, wird durch die nächste Eigenschaft gegeben. Beispiel 4 Verwenden Sie die Box-Pierce - und Ljung-Box-Statistik, um zu ermitteln, ob die ACF-Werte in Beispiel 2 für alle Verzögerungen kleiner oder gleich 5 (die Nullhypothese) statistisch gleich Null sind. Die Ergebnisse sind in Abbildung 4 dargestellt. Abbildung 4 Box-Pierce - und Ljung-Box-Tests Aus diesen Tests geht hervor, dass ACF (k) für mindestens ein k 5 signifikant unterschiedlich ist, was mit dem Korrelogramm in Abbildung 2 übereinstimmt. Real Statistik Funktionen. Das Real Statistics Resource Pack bietet die folgenden Funktionen, um die von den oben genannten Eigenschaften beschriebenen Tests durchzuführen. BARTEST (r, n, lag) p-Wert von Bartletts testen auf Korrelationskoeffizient r basierend auf einer Zeitreihe der Größe n für die angegebene Verzögerung. BARTEST (R1, lag) BARTEST (r, n, lag) wobei n die Anzahl der Elemente im Bereich R1 und r ACF (R1, lag) PIERCE (R1 ,, lag) Box-Pierce-Statistik Q für Bereich R1 und die angegebene Verzögerung BPTEST (R1 ,, lag) p-Wert für den Box-Pierce-Test für Bereich R1 und die spezifizierte Verzögerung LJUNG (R1 ,, lag) Ljung-Box Statistik Q für Bereich R1 und die spezifizierte Verzögerung LBTEST (R1 ,, lag) p - Wert für den Ljung-Box-Test für den Bereich R1 und die angegebene Verzögerung In den obigen Funktionen, bei denen das zweite Argument fehlt, wird der Test mit dem Autokorrelationskoeffizienten (ACF) durchgeführt. Wenn der Wert stattdessen 1 oder pacf ist, wird der Test unter Verwendung des partiellen Autokorrelationskoeffizienten (PACF) durchgeführt, wie im nächsten Abschnitt beschrieben. Tatsächlich, wenn das zweite Argument irgendeinen Wert außer 1 oder pacf annimmt, wird der ACF-Wert verwendet. Z. B. BARTEST (.303809,22,7) .07708 für Beispiel 3 und LBTEST (B4: B25, acf, 5) 1.81E-06 für Beispiel 4.Basisvorhersage Vorhersage bezieht sich auf den Prozess der Verwendung statistischer Verfahren zur Vorhersage zukünftiger Werte von a Zeitreihen auf der Grundlage historischer Trends. Für Unternehmen, in der Lage, erwartete Ergebnisse für einen bestimmten Zeitraum ist wichtig für die Verwaltung von Marketing, Planung und Finanzen. Zum Beispiel kann eine Werbeagentur die Verkaufsprognosen nutzen, um zu ermitteln, welche zukünftigen Monate erhöhte Marketingaufwendungen erfordern können. Unternehmen können auch Prognosen verwenden, um zu ermitteln, welche Vertriebsmitarbeiter ihre erwarteten Ziele für ein Geschäftsquartal erfüllt haben. Es gibt eine Reihe von Techniken, die genutzt werden können, um quantitative Prognosen zu generieren. Einige Methoden sind ziemlich einfach, während andere robuster sind und exogene Faktoren einbeziehen. Unabhängig von dem, was genutzt wird, sollte der erste Schritt immer sein, um die Daten mit einem Liniendiagramm zu visualisieren. Sie wollen überlegen, wie sich die Metrik im Laufe der Zeit ändert, ob es einen deutlichen Trend gibt oder ob es deutliche Muster gibt, die bemerkenswert sind. Es gibt mehrere Schlüsselbegriffe, die wir bei der Beschreibung von Zeitreihendaten erkennen sollten. Diese Merkmale informieren, wie wir die Daten vorverarbeiten und die entsprechende Modellierungstechnik und Parameter auswählen. Letztlich ist es das Ziel, die Muster in den historischen Daten zu vereinfachen, indem bekannte Variationsquellen entfernt und die Muster über den gesamten Datensatz hinweg konsistent gemacht werden. Einfachere Muster führen in der Regel zu genaueren Prognosen. Trend: Ein Trend besteht, wenn es eine langfristige Zunahme oder Abnahme der Daten gibt. Saisonalität: Ein saisonales Muster tritt auf, wenn eine Zeitreihe von saisonalen Faktoren wie der Zeit des Jahres oder dem Tag der Woche betroffen ist. Autokorrelation: Bezieht sich auf die Phänomene, wobei Werte von Y zum Zeitpunkt t durch vorherige Werte von Y bei t-i beeinflusst werden. Um die richtige Lag-Struktur und die Art der automatisch korrelierten Werte in Ihren Daten zu finden, verwenden Sie die Autokorrelations-Funktions-Plot. Stationär: Eine Zeitreihe soll stationär sein, wenn es keinen systematischen Trend gibt, keine systematische Veränderung der Varianz, und wenn streng periodische Variationen oder Saisonalität nicht existieren Quantitative Prognosetechniken basieren in der Regel auf Reression Analysen oder Zeitreihen Techniken. Regressionsansätze untersuchen die Beziehung zwischen der prognostizierten Variablen und anderen erläuternden Variablen unter Verwendung von Querschnittsdaten. Zeitreihenmodelle verwenden hitorische Daten, die in regelmäßigen Abständen über die Zeit gesammelt wurden, damit die Zielvariablen ihre zukünftigen Werte prognostizieren können. Es gibt keine Zeit, um die Theorie hinter jedem dieser Ansätze in diesem Beitrag zu decken, so dass I8217ve gewählt, um High-Level-Konzepte zu decken und Code für die Durchführung von Zeitreihen-Prognose in R darzustellen. Ich schlage vor, die statistische Theorie hinter einer Technik vor dem Ausführen des Codes zu verstehen. Zuerst können wir die Ma-Funktion im Prognosepaket verwenden, um die Vorhersage mit der gleitenden Durchschnittsmethode durchzuführen. Diese Technik schätzt zukünftige Werte zum Zeitpunkt t durch Mittelungswerte der Zeitreihen innerhalb von k Perioden von t ab. Wenn die Zeitreihe stationär ist, kann der gleitende Durchschnitt sehr effektiv sein, da die Beobachtungen in der Zeit über die Zeit sind. Die einfache exponentielle Glättung ist auch gut, wenn die Daten keine Trend - oder Saisonmuster haben. Anders als ein gleitender Durchschnitt gibt diese Technik den jüngsten Beobachtungen der Zeitreihen mehr Gewicht. In der Prognose-Paket gibt es eine automatische Prognose-Funktion, die durch mögliche Modelle laufen und wählen Sie die am besten geeignete Modell geben die Daten. Dies könnte ein auto regressives Modell der ersten oder (AR (1)), ein ARIMA-Modell mit den richtigen Werten für p, d und q oder etwas anderes, das besser geeignet ist. Da gehst du, eine grundlegende nicht-technische Einführung in die Prognose. Dies sollte man sich mit den wichtigsten Konzepten vertraut machen und wie man eine grundlegende Vorhersage in R verpasst. Verpassen Sie nie ein Update Abonnieren Sie R-Blogger, um E-Mails mit den neuesten R-Beiträgen zu erhalten. (Sie werden diese Nachricht nicht mehr sehen.) Crack GATEPSUsESE Total IES-2016 Selektionen: 159 Höchste Auswahl durch ein solches Institut, das IES-Engineering Services Coaching anbietet. Insgesamt GATE-2016 qualifiziert: 2225 1138 Schüler über 99 Perzentil einschließlich 11 Top-Ergebnisse unter AIR-20. Mehr als 300 E. I.I. Student, der renommierte Public Sector-Einheiten wie ONGC, NTPC, IOCL, ISRO, DRDO, Power Grid, NHPC, BHEL, BEL, HAL und viele weitere Organisationen bedient. 429 BSNL-JTO-Auswahl in Einzelrekrutierung des Jahres 2016. Unsere Leistungen sind die Ergebnisse der kombinierten Anstrengungen jedes Einzelnen. Ein Team von hoch engagierten IES (Eisenbahnen, CPWD, CES, Verordnung, BRO) amp GATE Qualified amp Profis aus verschiedenen Ingenieurhochschulen. Unser geplantes Lehrmodul wird Ihr technisches Verstärker nicht-technisches Wissen verbessern, das Ihnen dabei hilft, Impulse zu machen. Um CRACK jede konkurrierende Prüfung zu haben, musst du dich auf den Lehrplan konzentrieren und alle relevanten Themen werden in unserem Coaching-Modul gut behandelt. Wir halten Ihr Tempo hoch, um Grundlagen Grundlagen, die eine wichtige Rolle spielen, um Prüfungen wie GATE, IES Amp PSU39s zu knacken. Begrenzte Sitzkapazität pro Charge (40 Schüler) hilft Ihnen, Ihre dummen Zweifel zu löschen. Um Ihre Bemühungen zu motivieren, bieten wir Ihnen Topper39s Interaktions-Stipendien an, die Sie in der Lerntendenz festhalten. Untersuchungsorientiertes Studienmaterial, Testreihe Topic-weise Test hilft Ihnen, Ihr Potenzial zu pflegen. Führende und beste GATE Coaching Institute in Nordindien, die maximale Anzahl von Selektionen in GATE geben, IES amp PSU39s GATE 2018 Regelmäßiger Kurs GATE 2018 Wochenendkurs GATE 2018 Summer Batch Social Media Kontakt

No comments:

Post a Comment