Thursday 28 September 2017

Moving Average Model Stata


MOVAVG: Stata-Modul mit Mata generieren Moving Averages Bei Anforderung einer Korrektur, erwähnen Sie bitte diese Elemente behandeln: RePEc: boc: bocode: s457476. Siehe allgemeine Informationen zur Korrektur von Material in RePEc. Wenn Sie diesen Artikel verfasst haben und noch nicht bei RePEc registriert sind, empfehlen wir Ihnen, dies hier zu tun. Für technische Fragen zu diesem Artikel oder zur Korrektur seiner Autoren, Titel, Zusammenfassung, Bibliographie oder Download-Informationen kontaktieren Sie bitte: (Christopher F Baum) . Dadurch können Sie Ihr Profil mit diesem Element verknüpfen. Es erlaubt Ihnen auch, potenzielle Zitate zu diesem Punkt zu akzeptieren, dass wir uns unsicher sind. Wenn Referenzen vollständig fehlen, können Sie sie über dieses Formular hinzufügen. Wenn die vollständigen Referenzen ein Element auflisten, das in RePEc vorhanden ist, aber das System nicht mit ihm verknüpft ist, können Sie mit diesem Formular helfen. Wenn Sie über fehlende Elemente wissen, können Sie uns helfen, diese Links zu erstellen, indem Sie die entsprechenden Referenzen in der gleichen Weise wie oben hinzufügen. Wenn Sie ein registrierter Autor dieses Artikels sind, können Sie auch die Registerkarte Zitate in Ihrem Profil überprüfen, da es einige Zitate gibt, die auf die Bestätigung warten. Bitte beachten Sie, dass Korrekturen einige Wochen dauern können, um die verschiedenen RePEc-Dienste zu filtern. Mehr Leistungen Folgen Serien, Zeitschriften, Autoren amp mehr Neue Papiere per E-Mail Neuzugänge zu RePEc abonnieren Autor-Registrierung Öffentliche Profile für Wirtschaftswissenschaftler Verschiedene Rankings der Forschung in Wirtschaftswissenschaften amp verwandte Bereiche Wer war ein Student von wem, mit RePEc RePEc Biblio Kuratierte Artikel amp Papiere verschiedene Ökonomie-Themen Hochladen Sie Ihr Papier auf RePEc und IDEAS EconAcademics Blog-Aggregator für die Ökonomie Forschung Plagiat Fall Plagiat in Ökonomie Job-Marktpapiere RePEc Arbeitspapier-Serie auf dem Arbeitsmarkt Fantasy League Vorgeben Sie sind an der Spitze einer Volkswirtschaft Abteilung Services von der StL Fed Data, Forschung, Anwendungen amp mehr aus dem St. Louis FedStata: Datenanalyse und statistische Software Nicholas J. Cox, Durham Universität, Großbritannien Christopher Baum, Boston College egen, ma () und seine Grenzen Statarsquos offensichtlichste Befehl Zur Berechnung der gleitenden Mittelwerte ist die ma () - Funktion von egen. Bei einem Ausdruck wird ein gleitender Durchschnitt für diesen Ausdruck erstellt. Standardmäßig wird als 3. genommen, muss ungerade sein. Allerdings kann, wie der manuelle Eintrag angibt, egen, ma () nicht mit varlist kombiniert werden:. Und aus diesem Grund ist es nicht auf Paneldaten anwendbar. In jedem Fall steht er außerhalb des Satzes von Befehlen, die speziell für Zeitreihen geschrieben werden, siehe Zeitreihen für Details. Alternative Ansätze Zur Berechnung von Bewegungsdurchschnitten für Paneldaten gibt es mindestens zwei Möglichkeiten. Beide hängen davon ab, dass der Dataset vorher tsset wurde. Das ist sehr viel wert: nicht nur können Sie sich immer wieder spezifizieren Panel variabel und Zeit variabel, aber Stata verhält sich intelligent jede Lücken in den Daten. 1. Schreiben Sie Ihre eigene Definition unter Verwendung von Zeitreihenoperatoren wie L. und F. Geben Sie die Definition des gleitenden Durchschnitts als Argument für eine generierte Anweisung an. Wenn Sie dies tun, sind Sie natürlich nicht auf die gleich gewichteten (ungewichteten) zentrierten Bewegungsdurchschnitte beschränkt, die von egen, ma () berechnet wurden. Zum Beispiel würden gleich gewichtete Dreiphasenbewegungsdurchschnitte gegeben und einige Gewichte können leicht angegeben werden: Sie können natürlich einen Ausdruck wie log (myvar) anstelle eines Variablennamens wie myvar angeben. Ein großer Vorteil dieses Ansatzes ist, dass Stata automatisch das Richtige für Paneldaten macht: führende und nacheilende Werte werden in Panels ausgearbeitet, genauso wie Logik diktiert. Der bemerkenswerteste Nachteil ist, dass die Befehlszeile ziemlich lang werden kann, wenn der gleitende Durchschnitt mehrere Begriffe beinhaltet. Ein anderes Beispiel ist ein einseitiger gleitender Durchschnitt, der nur auf vorherigen Werten basiert. Dies könnte nützlich sein für die Erzeugung einer adaptiven Erwartung dessen, was eine Variable nur auf Informationen basieren wird: was könnte jemand prognostizieren für den aktuellen Zeitraum auf der Grundlage der letzten vier Werte, mit einem festen Gewichtungsschema (A 4-Periode Verzögerung sein könnte Besonders gebräuchlich mit vierteljährlichen Zeitreihen.) 2. Verwenden Sie egen, filter () von SSC Verwenden Sie den benutzerdefinierten egen function filter () aus dem egenmore package auf SSC. In Stata 7 (aktualisiert nach dem 14. November 2001) können Sie dieses Paket installieren, nachdem egenmore auf die Details zu filter () hingewiesen hat. Die beiden obigen Beispiele würden gerendert (In diesem Vergleich ist der generierte Ansatz vielleicht transparenter, aber wir sehen ein Beispiel des Gegenteils in einem Moment.) Die Lags sind eine Numliste. Führt zu negativen Verzögerungen: In diesem Fall erweitert sich -1/1 auf -1 0 1 oder Blei 1, lag 0, lag 1. Die Koeffizienten, eine weitere Numliste, multiplizieren die entsprechenden nacheilenden oder führenden Elemente: In diesem Fall sind diese Elemente F1.myvar Myvar und L1.myvar. Der Effekt der Normalisierungsoption besteht darin, jeden Koeffizienten durch die Summe der Koeffizienten zu skalieren, so daß coef (1 1 1) normalisiert ist, zu Koeffizienten von 1/3 1/3 1/3 äquivalent ist und coef (1 2 1) normalisiert Auf Koeffizienten von 1/4 1/2 1/4. Sie müssen nicht nur die Verzögerungen, sondern auch die Koeffizienten angeben. Da egen, ma () den gleich gewichteten Fall liefert, ist der Hauptgrund für egen, filter (), den ungleich gewichteten Fall zu unterstützen, für den Sie Koeffizienten angeben müssen. Es könnte auch gesagt werden, dass verpflichtende Benutzer Koeffizienten angeben ist ein wenig mehr Druck auf sie zu denken, welche Koeffizienten sie wollen. Die wichtigste Rechtfertigung für gleiche Gewichte ist, wir schätzen, Einfachheit, aber gleiche Gewichte haben miese Frequenzbereich Eigenschaften, um nur eine Erwägung zu erwähnen. Das dritte Beispiel oben könnte entweder von denen ist nur so kompliziert wie die Generierung Ansatz. Es gibt Fälle, in denen egen, filter () eine einfachere Formulierung ergibt als erzeugen. Wenn Sie einen neun-term-Binomialfilter suchen, der von den Klimatologen als nützlich empfunden wird, dann sieht es vielleicht weniger schrecklich aus und ist leichter zurecht zu kommen. Genau wie beim generierten Ansatz funktioniert egen, filter () ordnungsgemäß mit Panel-Daten. Tatsächlich hängt es, wie oben erwähnt, davon ab, daß der Dataset vorher tsset wurde. Eine grafische Spitze Nach der Berechnung Ihrer gleitenden Durchschnitte werden Sie wahrscheinlich einen Graphen betrachten wollen. Der benutzerdefinierte Befehl tsgraph ist schlau um Tsset-Datasets. Installieren Sie es in einem up-to-date Stata 7 von ssc inst tsgraph. Was ist mit der Teilmenge mit if Keine der obigen Beispiele verwenden, wenn Einschränkungen. In der Tat egen, ma () wird nicht zulassen, wenn angegeben werden. Gelegentlich Menschen wollen verwenden, wenn bei der Berechnung der gleitenden Durchschnitte, aber seine Verwendung ist ein wenig komplizierter als es normalerweise ist. Was würden Sie von einem gleitenden Durchschnitt erwarten? Lassen Sie uns zwei Möglichkeiten identifizieren: Schwache Interpretation: Ich möchte keine Ergebnisse für die ausgeschlossenen Beobachtungen sehen. Starke Interpretation: Ich möchte nicht, dass Sie die Werte für die ausgeschlossenen Beobachtungen verwenden. Hier ist ein konkretes Beispiel. Angenommen, infolge einer Bedingung sind die Beobachtungen 1-42 eingeschlossen, aber nicht die Beobachtungen 43 an. Aber der gleitende Durchschnitt für 42 wird unter anderem von dem Wert für die Beobachtung 43 abhängen, wenn der Mittelwert sich nach hinten und vorne erstreckt und eine Länge von mindestens 3 hat, und er wird in einigen Fällen von einigen der Beobachtungen 44 abhängen. Unsere Vermutung ist, dass die meisten Menschen für die schwache Interpretation gehen würde, aber ob das korrekt ist, egen, filter () nicht unterstützt, wenn entweder. Sie können immer ignorieren, was Sie donrsquot wollen oder sogar unerwünschte Werte auf fehlende danach mit replace setzen. Eine Notiz über fehlende Ergebnisse an den Enden der Serie Da gleitende Mittelwerte Funktionen von Lags und Leads sind, erzeugt eMe () fehlende Stellen, wo die Lags und Leads nicht existieren, am Anfang und Ende der Reihe. Eine Option nomiss zwingt die Berechnung der kürzeren, nicht beanspruchten gleitenden Mittelwerte für die Schwänze. Im Gegensatz dazu weder erzeugen noch egen, filter () macht oder erlaubt, etwas Besonderes, um fehlende Ergebnisse zu vermeiden. Wenn einer der für die Berechnung benötigten Werte fehlt, fehlt dieses Ergebnis. Es ist Aufgabe der Anwender, zu entscheiden, ob und welche Korrekturen für solche Beobachtungen erforderlich sind, vermutlich nach Betrachtung des Datensatzes und unter Berücksichtigung aller zugrunde liegenden Wissenschaft, die zum Tragen gebracht werden kann.11.2: Vector Autoregressive Modelle VAR (p) Modelle VAR Modelle (Vektor Autoregressive Modelle) werden für multivariate Zeitreihen verwendet. Die Struktur ist, dass jede Variable eine lineare Funktion der Vergangenheit Lags von sich selbst und Vergangenheit Lags der anderen Variablen ist. Als Beispiel nehmen wir an, dass wir drei verschiedene Zeitreihenvariablen messen, die mit (x), (x) und (x) bezeichnet sind. Das autoregressive Vektormodell der Ordnung 1, das als VAR (1) bezeichnet wird, ist wie folgt: Jede Variable ist eine lineare Funktion der Verzögerungswerte 1 für alle Variablen in dem Satz. In einem VAR (2) - Modell werden die Verzögerungswerte 2 für alle Variablen den rechten Seiten der Gleichungen hinzugefügt. Im Fall von drei x-Variablen (oder Zeitreihen) gibt es sechs Prädiktoren auf der rechten Seite jeder Gleichung , Drei Lag-1-Terme und drei Lag-2-Terme. Im Allgemeinen würden für ein VAR (p) - Modell die ersten p-Verzögerungen jeder Variablen im System als Regressions-Prädiktoren für jede Variable verwendet. VAR-Modelle sind ein spezieller Fall allgemeinerer VARMA-Modelle. VARMA-Modelle für multivariate Zeitreihen umfassen die VAR-Struktur oben mit gleitenden Durchschnittstermen für jede Variable. Noch allgemeiner sind dies spezielle Fälle von ARMAX-Modellen, die die Addition anderer Prädiktoren erlauben, die außerhalb des multivariaten Satzes von Hauptinteresse liegen. Hier, wie in Abschnitt 5.8 des Textes, auch auf VAR-Modelle. Auf Seite 304 passen die Autoren zu dem Modell der Form mathbf t Gamma mathbf t phi mathbf mathbf t wobei (mathbf t (1, t)) Terme enthält, um gleichzeitig die Konstante und den Trend zu platzieren. Es entstand aus makroökonomischen Daten, wo große Veränderungen in den Daten dauerhaft auf das Niveau der Serie. Es gibt einen nicht so subtilen Unterschied hier aus früheren Lektionen, dass wir jetzt ein Modell an Daten passen, die nicht stationär sein müssen. In früheren Versionen des Textes, die Autoren getrennt de-Trend jeder Serie mit einer linearen Regression mit t, der Index der Zeit, als Prädiktor-Variable. Die abgetasteten Werte für jede der drei Serien sind die Residuen aus dieser linearen Regression auf t. Das De-Trending ist sinnvoll, weil es die gemeinsame Lenkkraft, die die Zeit auf jede Serie haben kann und schafft Stationarität, wie wir in früheren Lektionen gesehen haben, entfernt. Dieser Ansatz führt zu ähnlichen Koeffizienten, wenn auch etwas anders, da wir jetzt gleichzeitig die Intercept und Trend zusammen in einem multivariaten OLS-Modell. Die von Bernhard Pfaff verfasste R vars-Bibliothek hat die Möglichkeit, dieses Modell mit Trend anzupassen. Betrachten wir 2 Beispiele: ein Differenz-stationäres Modell und ein Trend-stationäres Modell. Differenz-stationäres Modell Beispiel 5.10 aus dem Text ist ein Differenz-stationäres Modell, in dem die ersten Differenzen stationär sind. Lets untersuchen Code und Beispiel aus dem Text, indem Sie das Modell oben: install. packages (vars) Wenn nicht bereits installiert install. packages (astsa) Wenn nicht bereits installiert Bibliothek (Vars) Bibliothek (astsa) x cbind (cmort, tempr, (VAR (x, p1, typeboth)) Die ersten beiden Befehle laden die notwendigen Befehle aus der vars Bibliothek und die notwendigen Daten aus unserer Texbibliothek. Der Befehl cbind erzeugt einen Vektor von Antwortvariablen (ein notwendiger Schritt für multivariate Antworten). Der VAR-Befehl führt zur Schätzung von AR-Modellen mit gewöhnlichen kleinsten Quadraten bei gleichzeitiger Anpassung des Trend-, Intercept - und ARIMA-Modells. Das p 1 - Argument fordert eine AR (1) - Struktur an und passt sowohl konstant als auch trend. Mit dem Vektor der Antworten, seine eigentlich ein VAR (1). Es folgt die Ausgabe des VAR-Befehls für die Variable tempr (der Text liefert die Ausgabe für cmort): Die Koeffizienten für eine Variable werden in der Spalte Schätzung aufgelistet. Die an jeden Variablennamen angehängte. l1 gibt an, dass es sich um Variablen mit Verzögerung 1 handelt. Unter Verwendung der Notation T Temperatur, ttime (wöchentlich gesammelt), M Mortalitätsrate und P Verschmutzung ist die Gleichung für die Temperatur t 67.586 - .007 t - 0.244 M 0.487 T - 0.128 P Die Gleichung für die Mortalitätsrate ist Hut t 73.227 0,014 t 0.465 M - 0.361 T 0.099 P Die Gleichung für die Verschmutzung ist Hut t 67.464 - .005 t - 0.125 M - 0.477 T 0.581 P. Die Kovarianzmatrix der Reste aus dem VAR (1) für die drei Variablen wird unterhalb der Schätzergebnisse ausgedruckt. Die Varianzen sind die Diagonale und könnte möglicherweise verwendet werden, um dieses Modell zu höherer Ordnung VARs zu vergleichen. Die Determinante dieser Matrix wird bei der Berechnung der BIC-Statistik verwendet, die verwendet werden kann, um die Passung des Modells mit dem Fit anderer Modelle zu vergleichen (siehe Formeln 5.89 und 5.90 des Textes). Für weitere Referenzen zu dieser Technik siehe Analyse von integrierten und integrierten Zeitreihen mit R von Pfaff sowie Campbell und Perron 1991. In Beispiel 5.11 auf Seite 307 geben die Autoren Ergebnisse für ein VAR (2) - Modell für die Sterblichkeitsdaten an . In R können Sie das VAR (2) - Modell mit der Befehlsübersicht (VAR (x, p2, typeboth)) anpassen. Die Ausgabe, wie sie vom VAR-Befehl angezeigt wird, lautet wie folgt: Wieder werden die Koeffizienten für eine bestimmte Variable aufgelistet Die Spalte Schätzung. Als Beispiel ist die geschätzte Gleichung für die Temperatur t 49.88 - 0.005 t - 0.109 M 0.261 T 0.051 P - 0.041 M 0.356 T 0.095 P Wir werden die Informationskriterienstatistiken diskutieren, um VAR-Modelle verschiedener Ordnungen in den Hausaufgaben zu vergleichen. Residuen stehen auch zur Analyse zur Verfügung. Wenn wir beispielsweise den VAR-Befehl einem Objekt mit dem Namen fitvar2 in unserem Programm, fitvar2 VAR (x, p2, typeboth) zuordnen, haben wir Zugriff auf die Matrixresiduen (fitvar2). Diese Matrix hat drei Spalten, eine Spalte von Resten für jede Variable. Zum Beispiel könnten wir verwenden, um die ACF der Residuen für die Mortalitätsrate nach der Montage der VAR (2) - Modell zu sehen. Das folgende ist der ACF, der aus dem eben beschriebenen Befehl resultiert. Es sieht gut für eine Rest-ACF. (Die große Spitze am Anfang ist die unwichtige Verzögerungskorrelation.) Die folgenden zwei Befehle erzeugen ACFs für die Residuen für die beiden anderen Variablen. Sie ähneln auch weißem Rauschen. Wir können auch diese Diagramme in der Kreuzkorrelationsmatrix von acf (Residuen (fitvar2)) untersuchen: Die Diagramme entlang der Diagonalen sind die einzelnen ACFs für alle Modellresiduen, die wir oben diskutiert haben. Zusätzlich sehen wir nun die Kreuzkorrelationsdiagramme von jedem Satz von Resten. Im Idealfall ähneln diese auch weißen Rauschen, aber wir sehen die restlichen Kreuzkorrelationen, insbesondere zwischen Temperatur und Verschmutzung. Wie unsere Autoren bemerken, wird dieses Modell die vollständige Assoziation zwischen diesen Variablen nicht rechtzeitig erfassen. Trend-Stationäres Modell Erkunden Sie ein Beispiel, in dem die ursprünglichen Daten stationär sind und untersuchen Sie den VAR-Code, indem Sie das Modell oben mit einer Konstante und einem Trend anpassen. Bei Verwendung von R haben wir mit dem VAR (2) - Modell n 500 Beispielwerte simuliert. Mit dem oben erläuterten VAR-Befehl: y1scan (var2daty1.dat) y2scan (var2daty2.dat) Zusammenfassung (VAR (cbind (y1, y2), p2, typeboth) ) Wir erhalten die folgende Ausgabe: Die Schätzwerte liegen sehr nahe bei den simulierten Koeffizienten und der Trend ist, wie erwartet, nicht signifikant. Für stationäre Daten können Sie auch den Befehl ar. ols verwenden, um ein VAR-Modell anzupassen: fitvar2 ar. ols (cbind (y1, y2), order2) In der ersten angegebenen Matrix lesen Sie über eine Zeile, die Sie erhalten möchten Die Koeffizienten für eine Variable. Die vorhergehenden Kommas, gefolgt von 1 oder 2, geben an, ob die Koeffizienten die Variablen lag 1 bzw. lag 2 sind. Die Abschnitte der Gleichungen sind unter x. intercept ein Intercept pro Variable angegeben. Die Matrix unter var. pred gibt die Varianz-Kovarianzmatrix der Residuen aus dem VAR (2) für die beiden Variablen. Die Varianzen liegen der Diagonalen nach und könnten möglicherweise verwendet werden, um dieses Modell mit höherwertigen VARs, wie oben erwähnt, zu vergleichen. Die Standardfehler der AR-Koeffizienten werden durch den Befehl fitvar2asy. se. coef gegeben. Der Ausgang ist wie bei den Koeffizienten, über Zeilen gelesen. Die erste Zeile gibt die Standardfehler der Koeffizienten für die Verzögerungs-1-Variablen an, die y1 vorhersagen. Die zweite Zeile gibt die Standardfehler für die Koeffizienten, die y2 vorhersagen. Sie können beachten, dass die Koeffizienten in der Nähe des VAR-Befehls außer dem Intercept liegen. Das liegt daran, dass ar. ols das Modell für x-mean (x) schätzt. Um den durch die Zusammenfassung (VAR (cbind (y1, y2), p2, typeconst)) bereitgestellten Intercept zu berechnen, müssen Sie den Intercept wie folgt berechnen: In unserem Beispiel entspricht der Intercept für das simulierte Modell für yt1 -0,043637 -2.733607 (1-0.29300.4523) 15.45479 (-0.1913-0.6365) 9.580768, und die geschätzte Gleichung für yt, 1 Schätzung mit Minitab Für Minitab-Benutzer ist heres der allgemeine Ablauf dessen, was zu tun ist. Lesen Sie die Daten in Spalten. Verwenden Sie die Zeitreihe gt Lag, um die notwendigen verzögerten Spalten der stationären Werte zu erzeugen. Verwendung Stat gt ANOVA gt General MANOVA. Geben Sie die Liste der aktuellen Zeitvariablen als Antwortvariablen ein. Geben Sie die verzögerten x-Variablen als Kovariaten (und als Modell) ein. Klicken Sie auf Ergebnisse und wählen Sie Univariate Analyse (um die geschätzten Regressionskoeffizienten für jede Gleichung zu sehen). Klicken Sie bei Bedarf auf Speicher und wählen Sie Residuals und / oder Passt. Navigation

No comments:

Post a Comment