Multidimensional confidence regions for pareto, exponential, and normal distributions

  • Mehrdimensionale Konfidenzbereiche für Pareto-, Exponential- und Normalverteilungen

Lennartz, Jens; Kamps, Udo (Thesis advisor); Kateri, Maria (Thesis advisor)

Aachen (2017)
Doktorarbeit

Dissertation, RWTH Aachen University, 2017

Kurzfassung

Die beiden klassischen Ansätze der Schätztheorie sind die Punktschätzung und die Konfidenzintervallschätzung. Ein Konfidenzintervall enthält den unbekannten Parameter der betrachteten parametrischen Verteilungsfamilie mit einer Wahrscheinlichkeit, die größer oder gleich einem bestimmten Wert, dem Konfidenzniveau, ist. Wenn man sich mit mehrparametrigen Verteilungsfamilien befasst, ist man daran interessiert, den Parametervektor mittels mehrdimensionaler Konfidenzbereiche zu schätzen. Dabei können verschiedene Schwierigkeiten auftreten. Eine dieser Schwierigkeiten besteht darin, geeignete Pivot-Statistiken für den Parametervektor zu finden. Eine Pivot-Statistik ist eine Statistik, deren Verteilung nicht vom Parameter selber abhängt. Eine weitere Schwierigkeit entsteht dadurch, dass man in der Regel das Konfidenzniveau des Konfidenzbereichs im Voraus festlegen möchte. Bei den meisten (Standard-)Verfahren muss daher das Gesamtniveau geeignet auf die einzelnen Parameter aufgeteilt werden. Als Alternative dazu hat Jeyaratnam (1985) ein Theorem veröffentlicht, durch dessen Anwendung man einen Konfidenzbereich mit vorgegebenem Niveau erhält, wobei das Niveau nicht im Voraus aufgeteilt werden muss. Zusätzlich hat der resultierende Konfidenzbereich minimales Volumen unter allen auf die gleiche Pivot-Statistik basierenden Konfidenzbereichen. Bislang existieren erst wenige Anwendungen dieses Theorems. In dieser Dissertation wird das Theorem von Jeyaratnam zur Bestimmung von Konfidenzbereichen für die Parameter der Pareto-Verteilung, der zweiparametrigen Exponentialverteilung und der Normalverteilung verwendet. Für eine vollständige, eine Typ II rechtszensierte und eine beidseitig Typ II zensierte Stichprobe Pareto-verteilter Zufallsvariablen werden gemeinsame Konfidenzbereiche für die beiden Parameter der Pareto-Verteilung hergeleitet. Diese werden dann bezüglich Form und Volumen anhand von Simulationen mit bereits bekannten Konfidenzbereichen verglichen. Darüber hinaus wird der Fall zweier stochastisch unabhängiger Pareto-verteilter Stichproben betrachtet, und es werden gemeinsame Konfidenzbereiche für verschiedene Situationen präsentiert, in denen zum Beispiel einzelne Parameter als bekannt vorausgesetzt werden oder die beiden Stichproben einen gemeinsamen Parameter aufweisen. Anschließend werden einige der Resultate auf einen realen Datensatz angewendet. Bei der zweiparametrigen Exponentialverteilung liegt der Fokus im Einstichprobenfall auf Typ II rechtszensierte und beidseitig Typ II zensierte Daten, da für eine unzensierte Stichprobe bereits ein Minimalvolumen-Konfidenzbereich bekannt ist. Für beide betrachteten Arten der Zensierung erhält man Konfidenzbereiche mit minimalem Volumen. Im Typ II rechtszensierten Fall wird dieser hinsichtlich der Form und des Volumens mit einem aus der Literatur bekannten sowie einem mittels eines Standardverfahrens erhaltenen Konfidenzbereich verglichen. Am Beispiel dieser drei Konfidenzbereiche wird dann noch ein weiteres Gütekriterium für Konfidenzbereiche, die Überdeckungswahrscheinlichkeit falscher Parameter, kurz behandelt. Im Fall zweier stochastisch unabhängiger exponentialverteilter Stichproben werden zwei-, drei- und vierdimensionale Konfidenzbereiche minimalen Volumens hergeleitet, gefolgt von einer Anwendung auf einen realen Datensatz. Bei der Normalverteilung wird der Fall zweier stochastisch unabhängiger Stichproben genauer untersucht. Es werden verschiedene Situationen betrachtet und in allen Minimalvolumen-Konfidenzbereiche ermittelt. Des Weiteren wird für den unbekannten Erwartungswertvektor einer multivariaten Normalverteilung mit bekannter Kovarianzmatrix ein Konfidenzbereich minimalen Volumens hergeleitet. Zusätzlich werden an vielen Stellen Graphiken der erhaltenen Konfidenzbereiche bereitgestellt und in einigen Fällen geschlossene Formeln für das Volumen der jeweiligen Konfidenzbereiche angegeben.

Einrichtungen

  • Lehrstuhl für Statistik und Institut für Statistik u. Wirtschaftsmathematik [116410]
  • Fachgruppe Mathematik [110000]

Identifikationsnummern