Multidimensional modeling and inference of dichotomous item response data

  • Mehrdimensionale Modellierung und Inferenz von dichotomen Item Response Daten

Kornely, Mia Johanna Katharina; Kateri, Maria (Thesis advisor); Moustaki, Irini (Thesis advisor)

Aachen : RWTH Aachen University (2021)
Doktorarbeit

Dissertation, RWTH Aachen University, 2021

Kurzfassung

Zur Analyse der Fairness des Bildungssystems eines Landes und zur Unterstützung der Entwicklung von pädagogischen Konzepten sind fragebogen- und testbasierte Studien wichtige Werkzeuge. Wesentlich bei der Durchführung solcher Studien ist die Messung nicht direkt beobachtbarer Merkmale wie etwa der Fähigkeit von Schüler:innen in verschiedenen Fächern. Diese Merkmale werden durch latente Variablen modelliert. Diese Dissertation beschränkt sich auf dichotome Items, bei denen die möglichen Antworten zu jedem Item in zwei Kategorien unterteilt werden können (z.B. "korrekt" und "falsch"), und auf stetige latente Variablen. In der Item Response Theorie (IRT) wird die Wahrscheinlichkeit einer "korrekten" Antwort auf ein Item abhängig von der latenten Variable modelliert. Mehrdimensionale Modelle nehmen die Existenz mehrerer latenter Variablen an, welche in einem latenten Vektor zusammengefasst werden. Kapitel 1 gibt eine Übersicht über IRT Modelle und Methoden für die Schätzung von Modellparametern und latenten Vektoren. Ein Fokus liegt auf Generalized Linear Latent Variable Models (GLLVM) und Modellen mit einer geschlossen darstellbaren Marginalverteilung der Antwortvektoren. Kapitel 2 führt eine Erweiterung der GLLVM hinsichtlich einer Abhängigkeit von Form-Parametern der Linkfunktion und der Verteilung des latenten Vektors ein. Der Bezug dieser Modellklasse zu Modellen in der Literatur und ihre Vereinheitlichung in der Klasse werden dargestellt. Die Konsistenz und asymptotische Effizienz des marginalen Maximum-Likelihood-Schätzers (MMLS) wird bewiesen, woraus asymptotische Eigenschaften für verschiedene klassische Modelle folgen. Die asymptotische Chi-Quadrat-Verteilung der Wald-, Score- und Likelihood-Ratio-Statistiken wird aus der asymptotischen Effizienz des MMLE abgeleitet. Modellanpassung, Schätzung latenter Variablen, Testung gerschachtelter Modelle und Modellselektion werden in einer Simulationsstudie untersucht. In Kapitel 3 wird die asymptotische Theorie der Schätzung von latenten Vektoren diskutiert, welche als (empirische) Bayes'sche Punktschätzung mit vorheriger Schätzung der Parameter eines (mehrdimensionalen) IRT Modells interpretiert werden kann. Das primäre Ziel dieses Kapitels ist die Untersuchung von Varianten des Bernstein-von-Mises Theorems für latente Vektoren, d.h. deren asymptotische posterior Normalverteilung (APN). Dieses Kapitel beinhaltet eine umfassende Analyse von Fragen bzgl. Bernstein-von-Mises Theoremen und die Asymptotik der Schätzung von latenten Vektoren für binäre IRT. Aktuelle Resultate in Bezug zur Asymptotik der a-posteriori Verteilung einer latenten Variable in der IRT Literatur werden erweitert bzgl. des multivariaten Falls, der Art der Konvergenz, der betrachteten Schätzer und ihrer asymptotischen Effizienz. In Kapitel 4 wird eine lineare Approximation des a-posteriori-Erwartungswertes (aAPE) für latente Vektoren, basierend auf der Component-Statistic und der APN-Theorie, hergeleitet. Eigenschaften des aAPE werden mit einer Simulationsstudie untersucht. Ein neuer EM-Algorithmus für die MMLS hochdimensionaler logit Modelle wird hergeleitet mittels einer Kombination der APN-Theorie mit dem aAPE. Dieser EM-Algorithmus ist leicht zu implementieren für jede Dimension des latenten Vektors durch eine Vereinfachung von Schritten ähnlicher adaptiver Algorithmen für hochdimensionale Probleme. Kapitel 5 fokussiert sich auf die Parameterschätzung in hochdimensionalen Fällen, in denen klassische Methoden ungeeignet sind. Basierend auf einer Pseudo-Likelihood-Methode für eine Klasse verallgemeinerter IRT Modelle, die nicht generell als Latent Variable Model (LVM) interpretiert werden können, wird eine Methode hergeleitet, deren resultierende angepasste Modelle grundsätzlich äquivalent zu spezifischen LVM sind. Die implementierte Prozedur ist schnell, allerdings sind die Schätzer verzerrt. Bias und Effizienz des Schätzers werden mittels Simulationen studiert.

Einrichtungen

  • Fachgruppe Mathematik [110000]
  • Lehrstuhl für Statistik und Data Science [116510]

Identifikationsnummern

Downloads