On the detection of changes in the variance in high-dimensional $K$-sample situations

  • Über die Erkennung von Strukturbrüchen in der Varianz in Hochdimensionalen $K$ - Stichproben Situationen

Mause, Nils; Steland, Ansgar (Thesis advisor); von Sachs, Rainer (Thesis advisor)

Aachen : RWTH Aachen University (2021)
Doktorarbeit

Dissertation, RWTH Aachen University, 2021

Kurzfassung

In dieser Arbeit nehmen wir an, dass wir zum Zeitpunkt $T>0$ $K \in \mathbb N$ unabhängige Stichproben von $d_T \in \mathbb N$ - dimensionalen Vektorzeitreihen $Y_{T,j},\dots,Y_{T,j},j=1,\dots,K$, mit (möglicherweise verschiedenen) Längen $N_j \in \mathbb N$ beobachten. Mit dem Hintergrund, dass die Resultate für Sensor Monitoring Probleme eingesetzt werden sollen, nehmen wir zusätzlich an, dass die Koordinaten der hochdimensionalen Zufallsvektoren $Y_{T,j,i}$, $i=1,\dots,N_j$, einer kausalen linearen Prozess Struktur folgen. Projektionen $w_T' Y_{T,j}$ auf Basis einer solchen hochdimensionalen Zeitreihe mit einem geeigneten Gewichtungsvektor $w_T \in \mathbb R^{d_T}$ treten in natürlicher Art und Weise in vielen statistischen Verfahren auf, wie z.B. die Hauptkomponentenanalyse oder die Portfoliooptimierung, und sind eine übliche Methode im Umgang mit hochdimensionalen Daten. Wenn nun die Varianz solcher Projektionen genauer analysiert werden soll, treten quadratische Formen $w_T' \Sigma_T^{(j)} w_T$ und, allgemeiner, Bilinearformen $v_T' \Sigma_T^{(j)} w_T$ für $v_T,w_T \in \mathbb R^{d_T}$ sowie ihr nichtparametrischer Schätzer $v_T' \hat{\Sigma}^{(j)}_{T} w_T$ auf, wobei $\Sigma_{T}^{(j)}$ die Varianz-Kovarianzmatrix und $\hat{\Sigma}_{T}^{(j)}$ die Stichproben-Kovarianzmatrix ist. Um nun Strukturbrüche, die eventuell nur eine Teilmenge aller $K$ Stichproben betreffen, in der Varianz solcher Projektionen zu entdecken, wurden in dieser Dissertation zwei neue Teststatistiken entwickelt, eine basierend auf einer Summe von quadrierten Fehlern und die andere auf Basis einer Bilinearform der gepoolten Stichproben-Kovarianzmatrix. In dem hochdimensionalen Kontext, bei dem nicht nur der Zeithorizont $T$ (oder die Stichprobenumfänge $N_j$) gegen unendlich gehen, sondern auch die Dimension $d_T$ der Daten mit dem Zeithorizont $T$ mitwachsen darf, wurden neue schwache Approximationen für Funktionen von Bilinearformen durch Funktionen von Brownschen Bewegungen entwickelt. Diese Approximationen stellen keine Bedingungen an den Quotienten von Dimension und Stichprobenumfang, und sind deshalb auch für Situationen geeignet, in denen die Dimension $d_T$ viel schneller als der Stichprobenumfang $N_j$ oder der Zeithorizont $T$ wächst. Während die Approximationen auf einem reicheren Wahrscheinlichkeitsraum stattfinden, wird zusätzlich in der Ausarbeitung gezeigt, dass sie auch auf den originalen Wahrscheinlichkeitsraum zurückgeholt werden können, und dass sie sogar halten, wenn man die asymptotischen Varianzparameter der approximierenden Brownschen Bewegungen durch schwach konsistente Bartlett - Schätzer ersetzt. Die Statistiken werden ebenfalls empirisch evaluiert und analysiert durch Simulationen und eine Anwendung auf einen realen Datensatz. Hierbei zeigt sich, dass beide Statistiken Vorteile bieten, abhängig davon, welche Situation genau untersucht wird (früher Strukturbruch, später Strukturbruch oder einer in der Mitte des Zeitintervalls, Änderungen in den Standardabweichung der Innovationen oder in den Koeffizienten).Zusätzlich bieten die Approximationen auch die Möglichkeit, einen Test auf Varianzhomogenität in $K$ - Stichproben Situationen durchzuführen, sowie den Fall zu untersuchen, wenn nicht mehr nur eine einzige Bilinearform vorliegt, sondern eine wachsende Anzahl oder sogar unendlich viele. Für diese beiden Themen wurde ebenfalls die Performance durch Simulationen untersucht.

Identifikationsnummern

Downloads