Vorwort | 5 |
Inhaltsverzeichnis | 6 |
Teil I Einführung | 10 |
1 Einführung: Sozialwissenschaftliche Datenanalyse | 11 |
1 Moderne Sozialwissenschaft und die Bedeutung der Statistik | 11 |
2 Ziele und Zielgruppe des Handbuchs | 12 |
3 Themenauswahl | 13 |
4 Gliederung und Inhal | 14 |
5 Ausblick | 14 |
Literaturverzeichnis | 15 |
2 Kausalität als Gegenstand der Sozialwissenschaften und der multivariaten Statistik | 16 |
1 Einführung | 16 |
2 Was heißt Kausalität? | 17 |
2.1 Zeitliche Reihenfolge von Ereignissen als grundlegende Bedingung für Kausalität | 18 |
2.2 Kausalität als „innerer Zusammenhang“ von Ereignissen | 18 |
2.3 Die Veränderung von Ereignissen nach der Manipulierung anderer Ereignisse: Die Kontroll-Definition von Kausalität | 18 |
2.4 Kausalität als „Mechanismus“ | 19 |
2.5 Die kontrafaktische Definition von Kausalität: Was wäre wenn? | 19 |
2.6 Exkurs: Die Logik der Erklärung | 20 |
2.7 Ursachen als Anfangsbedingungen oder als Wenn-Komponente von Gesetzen: Die Gesetzes-Definition von Kausalität | 21 |
2.8 Zum Vergleich der Kausalitäts-Definitionen | 23 |
3 Kausalität in sozialwissenschaftlichen Experimenten | 24 |
4 Kausalität in multivariaten Analyseverfahren: Das Beispiel der Regression | 27 |
4.1 Enthalten Kausalmodelle Kausalaussagen? | 27 |
4.2 Regressionsanalyse und kausale Schlüsse | 28 |
4.3 Kausalität in anderen multivariaten Verfahren | 33 |
4.4 Gibt es Algorithmen für die Ermittlung von Kausalität? | 34 |
5 Einzelfallanalysen, historische Daten und die Prüfung von Kausalaussagen | 36 |
6 Kausalität in Messmodellen | 38 |
7 Resümee | 41 |
8 Literaturempfehlungen | 41 |
Literaturverzeichnis | 42 |
Teil II Grundlagen der Datenanalyse | 46 |
3 Datengewinnung und Datenaufbereitung | 47 |
1 Daten | 47 |
2 Formen der Datenerhebung | 49 |
2.1 Befragung | 49 |
Persönlich-Mündliches Interview | 53 |
Schriftliche Befragung | 54 |
Telefonbefragung | 56 |
Onlinebefragungen | 57 |
Entscheidung für eine Befragungsform | 60 |
2.2 Beobachtung | 61 |
3 Stichprobenziehung | 63 |
4 Datenaufbereitung | 66 |
4.1 Transkription | 66 |
4.2 Kodierung | 66 |
4.3 Plausibilisierung | 67 |
4.4 Gewichtung | 68 |
4.5 Archivierung | 68 |
5 Literaturempfehlungen | 69 |
Literaturverzeichnis | 69 |
4 Uni- und bivariate deskriptive Statistik | 71 |
1 Univariate Statistik | 71 |
1.1 Lagemaße | 71 |
Arithmetische Mittel | 71 |
Median (Zentralwert) | 72 |
Modalwert | 74 |
1.2 Streuungsmaße | 74 |
Varianz, Standardabweichung und Variationskoeffizient | 75 |
Spannweite, Quartilabstand und 5-Punkte-Zusammenfassung einer Verteilung | 77 |
Index qualitativer Variation | 78 |
1.3 Schiefe | 78 |
2 Bivariate Statistik | 79 |
2.1 Tabellenanalyse | 81 |
Spalten-, Zeilen- und Gesamtprozente | 81 |
Prozentuierung und statistische Unabhängigkeit | 82 |
Prozentsatzdifferenz | 83 |
Odds und Odds-Ratio | 84 |
Nominalskalierte Maße: Cramérs V | 85 |
Ordinalskalierte Merkmale | 87 |
2.2 Metrische Merkmale: Kovarianz und Korrelation | 91 |
3 Ausblick | 94 |
4 Literaturempfehlungen | 94 |
Literaturverzeichnis | 94 |
5 Graphische Datenexploration | 96 |
1 Einführung | 96 |
2 Graphische Methoden für die Datenexploration | 98 |
2.1 Einteilungskriterien für graphische Darstellungen | 98 |
2.2 Univariate Analysen | 99 |
Untersuchung der empirischen Häufigkeitsverteilung | 99 |
Vergleich von Verteilungen | 108 |
Die Darstellung von Zeitreihen | 112 |
2.3 Bivariate Analysen | 113 |
Das Anscombe-Quartett | 114 |
Streudiagramm | 115 |
2.4 Multivariate Analysen | 117 |
3 Fehlervermeidung und Hinweise zum praktischen Vorgehen | 119 |
4 Literaturempfehlungen | 120 |
Anhang | 120 |
Literaturverzeichnis | 121 |
6 Der Umgang mit fehlenden Werten | 122 |
1 Einführung in Techniken zur Kompensation fehlender Werte | 122 |
1.1 Klassifikation fehlender Werte, Missingmechanismus und Ignorierbarkeit | 122 |
1.2 Gewichtung | 125 |
Schätzung der Responsewahrscheinlichkeiten | 126 |
Gewichten oder nicht? | 127 |
Ergänzungen | 128 |
1.3 Multiple Imputation | 129 |
Voraussetzungen | 129 |
Erzeugung multipler Imputationen | 130 |
Auswertung multipel imputierter Datensätze | 132 |
Ergänzungen | 133 |
2 Mathematisch-statistische Grundlagen | 134 |
2.1 Klassifikation fehlender Werte, Missingmechanismus und Ignorierbarkeit | 134 |
2.2 Gewichtung | 135 |
2.3 Multiple Imputation | 137 |
3 Beispiel: Einkommensgleichung mit fehlenden Werten | 140 |
4 Häufige Fehler | 144 |
5 Literaturempfehlungen | 146 |
Literaturverzeichnis | 147 |
7 Gewichtung | 148 |
1 Einführung in das Verfahren | 148 |
2 Mathematisch-statistische Grundlagen | 150 |
2.1 Designgewichtung in komplexen Stichprobenerhebungen | 152 |
Schichtung | 153 |
Proportionale Aufteilung | 154 |
Disproportionale Schichtung | 154 |
Klumpenauswahl | 155 |
Auswahl mit ungleichen Wahrscheinlichkeiten | 156 |
2.2 Kombination von Anpassungs- und Designgewichtung | 158 |
3 Gewichtung am Beispiel des ESS | 163 |
4 Häufige Fehler | 168 |
5 Literaturempfehlungen | 168 |
Literaturverzeichnis | 168 |
8 Grundlagen des statistischen Schließens | 170 |
1 Einführung in die Fragestellung | 170 |
2 Statistisches Schätzen | 171 |
2.1 Eigenschaften von Schätzern | 172 |
2.2 Intervallschätzung | 175 |
3 Statistisches Testen | 179 |
3.1 Hypothesentests über Konfidenzintervalle | 179 |
3.2 Signifikanztests | 180 |
3.3 Berücksichtigung der Trennschärfe von Tests | 183 |
3.4 Wald-Tests, Score-Tests und Chiquadrat-Differenzen-Tests | 185 |
4 Anwendungsfehler und Anwendungsprobleme | 187 |
4.1 Fallzahlabhängigkeit | 188 |
4.2 Spezifikation der statistischen Fragestellung | 189 |
4.3 Fehlinterpretation von Ergebnissen statistischer Schlüsse | 190 |
Interpretation von Konfidenzintervallen | 190 |
Interpretation von Signifikanzen | 190 |
Formulierung der Forschungshypothese als Alternativhypothese | 191 |
Multiples Testen | 191 |
Modell-Fitting | 192 |
Stichprobenpläne als Quelle von Interpretationsfehlern | 193 |
5 Literaturhinweise | 193 |
Literaturverzeichnis | 194 |
9 Einführung in die Inferenz durch den nichtparametrischen Bootstrap | 195 |
1 Einführung in das Verfahren | 195 |
2 Mathematisch-statistische Grundlagen | 199 |
2.1 Standardfehler und Konfidenzintervall von ˆ? | 199 |
Normale Approximationsmethode | 200 |
Perzentil-Methode | 200 |
Bias-corrected and accelerated Methode (BCa) | 200 |
2.2 Besonderheiten bei der Anwendung des Bootstraps auf Umfragedaten | 202 |
3 Ein Beispiel | 203 |
3.1 Ermittlung des Standardfehlers und des Konfidenzintervalls mit Imputation | 205 |
4 Häufige Fehler | 206 |
5 Literaturempfehlungen | 208 |
Literaturverzeichnis | 208 |
10 Maximum-Likelihood Schätztheorie | 209 |
1 Einführung in das Verfahren | 210 |
2 Die Mechanik des Maximum-Likelihood Verfahrens | 212 |
2.1 Das ML-Verfahren zur Bestimmung eines Parameters | 213 |
2.2 Das ML-Verfahren zur Bestimmung mehrerer Parameter | 218 |
3 Statistische Eigenschaften der ML-Schätzer | 223 |
4 Inferenzstatistik und Modellanpassung | 226 |
4.1 Test auf Signifikanz individueller Parameter | 227 |
4.2 Test auf Signifikanz mehrerer Parameter | 228 |
Likelihood Ratio Test | 228 |
Wald-Test | 229 |
Lagrange Multiplikatortest | 230 |
4.3 Modellgüte | 231 |
McFadden R2 | 232 |
Wald- und LM-basierte R2 | 233 |
AIC und BIC | 234 |
5 Numerische Optimierungsverfahren | 235 |
6 Literaturempfehlungen | 237 |
Literaturverzeichnis | 238 |
Teil III Messen und Skalieren | 240 |
11 Reliabilität, Validität, Objektivität | 241 |
1 Einführung | 241 |
2 Objektivität | 242 |
2.1 Durchführungsobjektivität | 242 |
2.2 Auswertungsobjektivität | 243 |
2.3 Interpretationsobjektivität | 244 |
3 Reliabilität | 244 |
3.1 Retest-Reliabilität | 246 |
Beispiel zur Bestimmung der Retest-Reliabilität | 247 |
3.2 Die Paralleltest-Reliabilität | 247 |
3.3 Die Split-Half-Reliabilität | 248 |
Beispiel zur Bestimmung der Split-Half-Reliabilität | 249 |
3.4 Konsistenzanalysen | 250 |
Beispiel zur Bestimmung der internen Konsistenz | 250 |
3.5 Die Beurteilung der Höhe von Reliabilitätskoeffizienten | 251 |
4 Validität | 252 |
4.1 Die Inhaltsvalidität | 252 |
4.2 Kriteriumsvalidität | 253 |
4.3 Konstruktvalidität | 255 |
Konstruktvalidierung mittels Dimensionalitätsüberprüfung (Prüfung auf formaleValidität) | 255 |
Konstruktvalidierung mittels eines empirischen Vergleichs mit anderen, dasselbeKonstrukt messenden Instrumenten | 256 |
Konstruktvalidierung mittels der Überprüfung des Zusammenhangs zwischen Selbstund Fremdurteil | 257 |
5 Vorgehen zur Güteüberprüfung von Skalen | 258 |
6 Häufige Fehler | 259 |
7 Literaturempfehlungen | 259 |
Literaturverzeichnis | 260 |
12 Thurstone- und Likertskalierung | 261 |
1 Einleitung | 261 |
2 Thurstone Skalierung | 262 |
2.1 Die Methode der Paarweisen Vergleiche (Law of Comparative Judgement, LCJ) | 262 |
Grundlagen des Verfahrens | 262 |
Vorgehensweise bei der Skalierung | 264 |
Anwendungsbeispiel | 266 |
2.2 Die Methode der gleich erscheinenden Intervalle | 270 |
2.3 Die Methode der sukzessiven Intervalle (MSI) | 272 |
Grundlagen des Verfahrens | 272 |
Anwendungsbeispiel | 273 |
2.4 Häufige Fehler bei der Thurstone Skalierung | 277 |
3 Likertskalierung | 277 |
3.1 Grundlagen des Verfahrens | 277 |
3.2 Anwendungsbeispiel | 279 |
3.3 Häufige Fehler bei der Likert Skalierung | 282 |
4 Literaturempfehlungen | 282 |
Literaturverzeichnis | 282 |
13 Guttman- und Mokkenskalierung | 284 |
1 Einleitung | 284 |
2 Guttmanskalierung | 286 |
2.1 Grundlagen des Verfahrens | 286 |
Modellannahmen | 288 |
Schätzung von Item- und Personenparametern | 289 |
Stichprobenabhängigkeit der Schätzung von Item- und Personenparametern | 290 |
Modellprüfung | 291 |
2.2 Anwendungsbeispiel | 297 |
2.3 Häufige Fehler bei der Guttmanskalierung | 299 |
3 Mokkenskalierung | 300 |
3.1 Grundlagen des Verfahrens | 300 |
Modellprüfung | 302 |
3.2 Anwendungsbeispiel | 306 |
3.3 Häufige Fehler bei der Mokkenskalierung | 308 |
4 Literaturempfehlungen | 308 |
Literaturverzeichnis | 309 |
14 Item-Response-Theorie | 311 |
1 Einführung | 312 |
2 Modelle für dichotome Items | 313 |
2.1 Das Rasch-Modell | 313 |
2.2 Das Birnbaum-Modell | 316 |
2.3 Das Modell mit Rateparameter | 317 |
3 Modelle für mehrstufig geordnete Items | 318 |
3.1 Das ordinale Rasch-Modell (Partial-Credit-Modell) | 318 |
3.2 Weitere IRT-Modelle für ordinale Items | 320 |
4 Weitere IRT-Modelle | 321 |
4.1 Mischverteilungs-IRT-Modelle: Das Mixed-Rasch-Modell | 321 |
5 Modelltestung und Modellvergleiche | 322 |
6 Beispielanwendung | 324 |
6.1 Anwendung 1: Kompetenzmessung | 324 |
6.2 Anwendung 2: Surveyforschung | 326 |
7 Häufige Fehler | 330 |
8 Literaturempfehlungen | 331 |
Literaturverzeichnis | 331 |
15 Hauptkomponentenanalyse und explorative Faktorenanalyse | 333 |
1 Einführung in das Verfahren | 333 |
1.1 Einsatzmöglichkeiten | 333 |
1.2 Die Hauptkomponentenanalyse | 336 |
Eine geometrische Perspektive | 336 |
Die konkreten Schritte der PCA | 340 |
Bestimmung der Komponentenzahl | 341 |
Die unrotierte Lösung | 343 |
Rotation | 344 |
Berechnung von Komponentenwerten | 347 |
1.3 Das Modell mehrerer gemeinsamer Faktoren: Faktorenanalyse im engeren Sinne | 348 |
2 Mathematisch-statistische Grundlagen | 350 |
3 Ein Anwendungsbeispiel: Vertrauen in Institutionen | 354 |
4 Probleme und Erweiterungen | 360 |
5 Literaturempfehlungen | 363 |
Anhang | 364 |
Literaturverzeichnis | 364 |
16 Korrespondenzanalyse | 366 |
1 Einleitung | 366 |
2 Mathematisch-statistische Grundlagen | 368 |
3 Ein Beispiel | 370 |
3.1 Graphische Darstellung | 370 |
3.2 Numerische Darstellung | 373 |
4 Erweiterungen der Korrespondenzanalyse | 376 |
4.1 Zusammengesetzte Tabellen | 376 |
4.2 Multiple Korrespondenzanalyse | 378 |
4.3 Aktive und passive Merkmale | 382 |
4.4 Andere Datenformate | 384 |
5 Häufige Fehler | 385 |
6 Diskussion | 386 |
7 Literaturempfehlungen | 386 |
Literaturverzeichnis | 387 |
17 Multidimensionale Skalierung | 389 |
1 Einführung in die MDS | 389 |
1.1 Die MDS als psychologisches Modell | 390 |
1.2 Die MDS zur Exploration von Datenstrukturen | 392 |
2 Mathematische Grundlagen der MDS | 393 |
2.1 Güte einer MDS-Lösung | 393 |
2.2 Bewertung des Stress | 395 |
2.3 MDS-Modelle | 397 |
2.4 MDS-Algorithmen | 400 |
2.5 Konfirmatorische MDS | 400 |
3 Häufige Fehler | 403 |
3.1 Degenerierte Lösungen in der ordinalen MDS | 403 |
3.2 Falsche Polung der Proximitäten | 405 |
3.3 Fehlbewertung von Stress | 406 |
3.4 Fehler beim Vergleich verschiedener MDS-Lösungen | 407 |
3.5 Mechanische Interpretation „der“ Dimensionen | 409 |
3.6 Behandlung störender Punkte | 412 |
3.7 Überinterpretation von Dimensionsgewichten | 413 |
4 Literaturempfehlungen | 413 |
Anhang | 414 |
Literaturverzeichnis | 415 |
Teil IV Analyse von Häufigkeiten, Gruppen und Beziehungen | 417 |
18 Analyse kategorialer Daten | 418 |
1 Einführung in das Verfahren | 418 |
2 Mathematisch-statistische Grundlagen | 430 |
3 Ein Beispiel | 440 |
4 Häufige Fehler | 448 |
5 Literaturempfehlungen | 450 |
Literaturverzeichnis | 450 |
19 Varianz- und Kovarianzanalyse | 452 |
1 Einführung in das Verfahren | 452 |
1.1 Vergleich von zwei Gruppen | 454 |
Modellgleichung | 455 |
Hypothesen | 455 |
Quadratsummen | 456 |
Freiheitsgrade | 457 |
Allgemeine Teststatistik | 457 |
Annahmen | 459 |
Exkurs: Mittlere Quadratsummen | 460 |
1.2 Vergleich von mehr als zwei Gruppen: Die einfaktorielle Varianzanalyse | 461 |
1.3 Mehrfaktorielle Varianzanalyse | 462 |
Modellgleichung | 462 |
Hypothesen | 463 |
Quadratsummen | 463 |
Freiheitsgrade | 464 |
Teststatistik | 465 |
Annahmen | 465 |
1.4 Kovarianzanalyse | 466 |
Modellgleichung | 467 |
ANOVA versus ANCOVA | 467 |
1.5 Effektstärke | 468 |
1.6 Teststärke | 471 |
2 Mathematisch-statistische Grundlagen | 472 |
2.1 ANOVA und ANCOVA als Spezialfälle des ALM | 473 |
2.2 Jenseits von ANOVA und ANCOVA: Kreative Modellierung im Rahmen des ALM | 477 |
3 Ein Beispiel | 480 |
3.1 Vergleich von zwei Gruppen | 480 |
3.2 Vergleich von mehr als zwei Gruppen | 481 |
3.3 Mehrfaktorielle ANOVA | 482 |
3.4 Kovarianzanalyse | 484 |
3.5 Annahmen der Varianz- und Kovarianzanalyse | 484 |
3.6 Teststärke | 488 |
4 Häufige Fehler – eine Checkliste | 488 |
5 Literaturempfehlungen | 489 |
Literaturverzeichnis | 489 |
20 Diskriminanzanalyse | 491 |
1 Einführung in das Verfahren | 491 |
1.1 Zielsetzung und Anwendungsmöglichkeiten | 491 |
1.2 Problemstellung und Prämissen | 493 |
1.3 Arten der Diskriminanzanalyse und ihre Abgrenzung gegenüber anderen multivariaten Verfahren | 495 |
1.4 Vorgehensweise | 497 |
Festlegung des Untersuchungsdesigns | 497 |
Extraktion der Diskriminanzfunktion(en) | 498 |
Evaluation der Diskriminanzfunktion(en) | 500 |
Merkmalsselektion und Klassifikation neuer Objekte | 502 |
2 Mathematisch-statistische Grundlagen | 503 |
2.1 Ermittlung der Diskriminanzfunktion (en) | 503 |
2.2 Prüfkriterien der Diskriminanz | 507 |
2.3 Klassifikationskonzepte | 508 |
Distanzkonzept | 509 |
Wahrscheinlichkeitskonzept | 510 |
Konzept der Klassifikationsfunktionen nach Fisher | 510 |
3 Anwendungsbeispiel | 511 |
4 Häufige Fehler | 515 |
5 Literaturempfehlungen | 517 |
Literaturverzeichnis | 518 |
21 Clusteranalyse | 520 |
1 Einführung in das Verfahren | 520 |
1.1 Was ist Clusteranalyse und was sind überhaupt Cluster? | 521 |
1.2 Clusterstruktur | 522 |
1.3 Algorithmen | 522 |
1.4 Variablenräume | 523 |
1.5 Agglomerative Verfahren | 524 |
Ähnlichkeitsmaß, Distanz und Index | 524 |
Fusionswerte und Dendrogramme | 525 |
1.6 Wahl der Metriken und Agglomerationsverfahren | 526 |
1.7 K-Means (Clusterzentrenanalyse) | 527 |
1.8 TwoStep-Clusteranalyse | 529 |
2 Mathematisch-statistische Grundlagen | 530 |
2.1 Hierarchisch-agglomerative Verfahren | 530 |
Ähnlichkeitsmaße und Distanzen | 530 |
Gewichtung und Standardisierung von Variablen | 532 |
Erweiterung der Abstandsmaße auf Abstände zwischen Aggregaten | 532 |
Dendrogramm und Ultrametrik | 533 |
2.2 K-Means | 534 |
2.3 TwoStep-Verfahren | 534 |
Die beiden Stufen der Clusterung | 534 |
Anzahl der Cluster | 535 |
Tabellen und Graphiken zur Beschreibung der Cluster | 536 |
3 Beispiel | 536 |
3.1 Daten- und Variablenauswahl | 536 |
3.2 Analyse | 537 |
3.3 Verbesserung der Clusterlösung | 540 |
Variablenauswahl | 540 |
Eliminieren von „Ausreißern“ | 540 |
Optimierung der Lösung durch eine K-Means-Analyse | 541 |
3.4 Überprüfen der Clusterlösung | 542 |
3.5 TwoStep-Clusteranalyse | 543 |
4 Häufige Fehler | 545 |
5 Literaturempfehlungen | 546 |
Literaturverzeichnis | 547 |
22 Analyse latenter Klassen | 548 |
1 Einführung in das Verfahren | 548 |
2 Mathematisch-statistische Grundlagen | 550 |
2.1 Modellansatz | 550 |
2.2 Parameterschätzung | 551 |
2.3 Computerprogramme | 553 |
3 Ein Beispiel | 555 |
3.1 Daten | 555 |
3.2 Zahl der latenten Klassen | 555 |
3.3 Lokale Unabhängigkeit | 559 |
3.4 Inhaltliche Interpretierbarkeit | 560 |
3.5 Stabilität | 562 |
3.6 Formale Validitätsprüfung durch Validitätsindizes | 564 |
3.7 Kriterienbezogene Validitätsprüfung | 564 |
4 Häufige Fehler | 566 |
5 Alternativen | 567 |
6 Literaturempfehlungen | 568 |
Literaturverzeichnis | 569 |
23 Netzwerkanalyse | 570 |
1 Einführung | 570 |
2 Darstellung der Verfahren | 575 |
2.1 Konzepte zur Beschreibung der Netzstruktur in Dyaden und Triaden | 576 |
Dyaden | 577 |
Triaden | 578 |
Triadische Umgebungen einzelner Knoten | 579 |
2.2 „Positionen“: Die Klassierung von Knoten aufgrund ähnlicher Muster ihrer strukturellen Einbettung | 582 |
2.3 Teilgruppen: Die Identifikation von Teilnetzen intern eng bzw. stark verbundener Knoten | 586 |
Cliquen und Clans | 587 |
k-Plexe und k-Cores | 588 |
Zusammenhangs-Komponenten | 588 |
Modifikation der Teilgruppenkonzepte für gerichtete Beziehungen | 589 |
3 Ein Beispiel | 589 |
3.1 Daten | 589 |
3.2 Zielsetzungen | 591 |
3.3 Erstellung des Datensatzes | 592 |
4 Literaturempfehlungen | 596 |
Literaturverzeichnis | 597 |
Teil V Regressionsverfahren für Querschnittsdaten | 599 |
24 Lineare Regressionsanalyse | 600 |
1 Einführung | 600 |
2 Mathematisch-statistische Grundlagen | 605 |
2.1 Das allgemeine Modell | 605 |
2.2 Die Identifikation der Regressionskoeffizienten | 606 |
2.3 Annahmen der Kleinst-Quadrat-Methode | 608 |
2.4 Die Bestimmung der Modellgüte | 610 |
2.5 Die statistische Absicherung der Regressionsergebnisse | 612 |
2.6 Die Interpretation der Regressionskoeffizienten | 616 |
2.7 Standardisierte Regressionskoeffizienten und ihre Probleme | 618 |
3 Ein Beispiel | 621 |
3.1 Zur Operationalisierung | 621 |
3.2 Ergebnisse | 622 |
4 Häufige Fehler | 628 |
5 Literaturhinweise | 630 |
Literaturverzeichnis | 630 |
25 Lineare Regression: Modellannahmen und Regressionsdiagnostik | 632 |
1 Einführung | 632 |
1.1 Lineares Regressionsmodell: Systematischer Teil, Störgrößen und Residuen | 633 |
1.2 Regressionsdiagnostik: ein erster Einblick | 635 |
2 Mathematisch-statistische Grundlagen | 638 |
2.1 Annahmen der linearen Regressionsanalyse | 638 |
2.2 Grundlagen und Instrumente der Regressionsdiagnostik | 645 |
Stichprobenresiduen und „Leverage“-Werte als Bausteine der Regressionsdiagnostik | 645 |
Diagnostik zu den Annahmen des klassischen linearen Regressionsmodells | 646 |
Diagnostik zu potenziell einflussreichen Untersuchungseinheiten | 652 |
3 Regressionsdiagnostik am Beispiel | 655 |
3.1 Datengrundlage und Regressionsmodell | 655 |
3.2 Regressionsdiagnostik zu den Annahmen des linearen Regressionsmodells am Beispiel | 656 |
3.3 Regressionsdiagnostik zu einflussreichen Beobachtungen am Beispiel | 661 |
4 Regressionsdiagnostik: Umfang, Probleme und Empfehlungen | 665 |
5 Literaturempfehlungen | 666 |
Anhang | 667 |
Literaturverzeichnis | 667 |
26 Nicht-Linearität und Nicht-Additivität in der multiplen Regression: Interaktionseffekte, Polynome und Splines | 669 |
1 Einführung | 669 |
2 Interaktionseffekte, Polynome und Splines | 670 |
2.1 Nicht-Additivität: Interaktionseffekte | 670 |
2.2 Nichtberücksichtigung von Interaktionen als Fehlspezifikation | 673 |
2.3 Nicht-Linearität: Polynome und Splines | 674 |
2.4 Polynome | 675 |
2.5 Splines | 677 |
3 Tests auf Gruppenunterschiede und Nicht-Linearität | 681 |
4 Anwendungsbeispiel I: Interaktionseffekte | 683 |
5 Anwendungsbeispiel II: Polynome und Slopes | 689 |
6 Häufige Fehler | 696 |
7 Literaturempfehlungen | 697 |
Literaturverzeichnis | 697 |
27 Robuste Regression | 699 |
1 Einführung in das Verfahren | 699 |
2 Mathematisch-statistische Grundlagen | 709 |
2.1 Der Kleinste-Quadrate-Schätzer | 709 |
2.2 Grundlegende Konzepte zur Bewertung robuster Schätzer | 710 |
Erwartungstreue, Konsistenz und Effizienz | 710 |
Relative Effizienz | 711 |
Einfluss-Funktion, Bruchpunkt und maximale Verzerrung | 712 |
Zusammenfassung | 713 |
2.3 M-Schätzer | 713 |
Berechnung von M-Schätzern | 717 |
Bruchpunkt von M-Schätzern | 719 |
Bounded-Influence-Schätzer | 719 |
2.4 High-Breakdown-Schätzer | 720 |
LMS- und LTS-Schätzer | 720 |
S-Schätzer | 721 |
MM-Schätzer | 722 |
3 Ein Beispiel | 723 |
4 Literaturempfehlungen | 729 |
Literaturverzeichnis | 730 |
28 Mehrebenenanalyse mit Querschnittsdaten | 733 |
1 Einführung in das Verfahren | 733 |
2 Mathematisch-statistische Grundlagen | 741 |
2.1 Die Modellklassen der Mehrebenenanalyse | 743 |
Das Random-Intercept-Only-Modell (R-I-O-M) | 743 |
Das Random-Intercept-Modell (R-I-M) | 744 |
Random-Intercept-Random-Slope-Modell (R-I-R-S-M) | 744 |
Das Intercept-as-Outcome-Modell (I-as-O-M) | 745 |
Das Random-Coefficient-Modell (R-C-M) | 746 |
2.2 Beurteilung der Anpassung des Mehrebenenmodells | 747 |
2.3 Zentrierung metrischer Prädiktoren und ihre Bedeutung für die Interpretation | 749 |
Grand-Mean-Zentrierung | 749 |
Group-Mean-Zentrierung | 750 |
2.4 Standardisierung der kontextspezifischen und Populationsschätzer | 752 |
2.5 Besonderheiten des Erhebungsdesigns | 754 |
3 Ein Beispiel – Die deutsche PISA 2006 Studie | 755 |
4 Häufige Fehler | 763 |
5 Literaturempfehlungen | 764 |
Literaturverzeichnis | 765 |
29 Strukturgleichungsmodelle | 767 |
1 Einführung in das Verfahren | 767 |
1.1 Ausgangspunkt: Regressions- und Pfadmodell | 768 |
1.2 Das Messmodell: Die Diffenzierung zwischen manifesten und latenten Variablen | 769 |
1.3 Die konfirmatorische Faktorenanalyse: Die simultane Prüfung mehrerer Messmodelle | 771 |
1.4 Das allgemeine Strukturgleichungsmodell | 773 |
Modellevaluation | 775 |
Modellvergleich | 776 |
Modellsparsamkeit | 777 |
1.5 Spezielle Modellvarianten | 778 |
Modelle für mehrere Gruppen (Multiple Gruppenvergleiche) | 778 |
Längsschnittmodelle | 778 |
Modelle mit Interaktionstermen | 778 |
Die Behandlung fehlender Werte | 779 |
2 Mathematisch-statistische Grundlagen | 779 |
2.1 Ableitung der Elemente der Kovarianzmatrix ? | 779 |
2.2 Schätzung der Parameter | 780 |
3 Ein Beispiel | 783 |
3.1 Messung der latenten Konstrukte | 785 |
3.2 Messmodell der latenten endogenen Variablen | 785 |
3.3 Messmodell der latenten exogenen Variablen | 785 |
3.4 Überprüfung der Messmodelle | 786 |
3.5 Intervenierende Variablen | 788 |
3.6 Strukturgleichungsmodell | 788 |
4 Häufige Fehler | 790 |
5 Literaturempfehlungen | 792 |
Anhang | 793 |
Literaturverzeichnis | 794 |
30 Regression mit unbekannten Subpopulationen | 797 |
1 Einführung in das Verfahren | 797 |
2 Mathematisch-statistische Grundlagen | 799 |
2.1 Spezifikation | 800 |
2.2 Schätzung | 805 |
2.3 Test auf die Anzahl der Komponenten | 807 |
2.4 Anpassungsindizes | 808 |
3 Ein Beispiel | 808 |
4 Häufige Fehler | 816 |
5 Literaturempfehlungen | 816 |
Literaturverzeichnis | 817 |
31 Logistische Regression | 818 |
1 Einführung in das Verfahren | 818 |
1.1 Das lineare Wahrscheinlichkeitsmodell | 819 |
1.2 Die logistische Regression | 820 |
1.3 Interpretation der Koeffizienten | 822 |
2 Mathematisch-statistische Grundlagen | 825 |
2.1 Herleitung als nichtlineares Modell mit latenter abhängiger Variable | 825 |
Logit-Regression | 825 |
Probit-Regression | 827 |
2.2 Schätzung | 827 |
2.3 Vergleich von Koeffizienten und unbeobachtete Heterogenität | 828 |
Standardisierte Koeffizienten | 829 |
Durchschnittliche marginale Effekte | 830 |
2.4 Interaktionseffekte | 831 |
2.5 Statistische Inferenz | 833 |
2.6 Goodness of fit und Modellvergleich | 834 |
3 Ein Beispiel | 835 |
4 Häufige Fehler | 843 |
5 Literaturempfehlungen | 844 |
Literaturverzeichnis | 845 |
32 Multinomiale und ordinale Regression | 846 |
1 Einführung in das Verfahren | 846 |
1.1 Von der binären zur multinomialen logistischen Regression | 847 |
1.2 Wahrscheinlichkeiten, Odds und Logits | 848 |
1.3 Modellschätzung und statistische Tests | 852 |
Besteht ein Zusammenhang? | 853 |
Wie stark ist ein Zusammenhang? | 853 |
Wie stark sind die relativen Effekte der erklärenden Variablen? | 854 |
1.4 Logistische Regression bei einer ordinalen abhängigen Variablen | 855 |
1.5 Interpretation des Modells der kumulierten Logits als vorgelagertes Schwellenwertmodell in einer linearen Regression | 857 |
2 Mathematisch-Statistische Grundlagen | 859 |
2.1 Schätzung | 859 |
2.2 Statistische Inferenz | 860 |
2.3 Modellanpassung | 861 |
2.4 Weiterführendes zu Regressionskoeffizienten | 862 |
Standardisierte Koeffizienten im ordinalen Regressionsmodell | 862 |
Umrechnen der Referenzkategorie im multinomialen Regressionsmodell | 862 |
3 Anwendungsbeispiel | 863 |
3.1 Einfluss der Bildungsabschlüsse von Vater und Mutter auf die Bildung der Befragten in der multinomialen logistischen Regression | 863 |
3.2 Bildungsabschluss im ordinalen Logitmodell | 870 |
4 Häufige Fehler | 873 |
5 Literaturempfehlungen | 877 |
Literaturverzeichnis | 877 |
33 Regression für Zählvariablen | 878 |
1 Einführung in das Verfahren | 878 |
1.1 Poisson und negative Binomialverteilung | 879 |
1.2 Regressionsmodellierung | 880 |
Strukturkomponente | 880 |
Strukturkomponente: lineare und nichtlineare Prädiktoren | 881 |
Verteilungskomponente | 883 |
Inferenz | 883 |
2 Mathematisch-statistische Grundlagen | 884 |
2.1 Poissonmodell | 884 |
Maximum-Likelihood-Schätzung | 884 |
Parameter-Tests | 885 |
Devianz und Anpassungstests | 887 |
2.2 Quasi-Poissonmodell | 888 |
2.3 Modell der negativen Binomialverteilung | 889 |
3 Ein Beispiel | 889 |
4 Häufige Fehler | 893 |
5 Literaturempfehlungen | 894 |
Literaturverzeichnis | 894 |
34 Graphische Darstellung regressionsanalytischer Ergebnisse | 896 |
1 Einführung in das Verfahren | 896 |
2 Grundlagen der graphischen Darstellung | 897 |
3 Beispiele | 900 |
3.1 Streudiagramm- bzw. Scatterplot-Matrix | 900 |
3.2 Median- und Mean-Regression | 902 |
3.3 Lineare Regression: Graphische Darstellung der Koeffizienten | 903 |
3.4 Lineare Regression: Die Darstellung vorhergesagter Werte (Conditional-Effect-Plots) | 905 |
3.5 Logistische Regression: Conditional-Effect-Plots | 908 |
3.6 Multinomiale Regression: Odds Ratio-Plots, Discrete-Change und Conditional-Effect-Plots | 911 |
4 Häufige Fehler | 915 |
5 Rückblick | 916 |
6 Literaturempfehlungen | 917 |
Literaturverzeichnis | 918 |
Teil VI Analyse von zeitbezogenen Daten | 919 |
35 Nichtparametrische Schätzung kausaler Effekte mittels Matchingverfahren | 920 |
1 Einführung in das Verfahren | 920 |
1.1 Grundannahmen kausaler Inferenz in Matchingverfahren | 921 |
1.2 Treatmenteffekte als Schätzgrößen der empirischen Analyse | 924 |
1.3 Durchführung der empirischen Analyse | 925 |
1.4 Varianten von Matchingverfahren bei Vorliegen unterschiedlicher Datenstrukturen | 930 |
2 Mathematisch-statistische Grundlagen | 931 |
3 Ein Anwendungsbeispiel: der Einkommenseffekt eines Arbeitsplatzverlustes | 937 |
3.1 Zuweisungsmodell | 938 |
3.2 Matching und Balancierungstests | 940 |
3.3 Parameterschätzung | 944 |
4 Häufige Fehler | 947 |
5 Literaturempfehlungen | 949 |
Literaturverzeichnis | 949 |
36 Kausalanalyse mit Paneldaten | 951 |
1 Einführung in die Paneldatenanalyse | 951 |
1.1 Kontrafaktische Kausalanalyse und Paneldaten | 952 |
1.2 Eine intuitive Einführung in Panelregressionsmodelle | 954 |
1.3 Ein didaktisches Beispiel | 956 |
2 Eine präzisere Einführung in die Panelregression | 959 |
2.1 Das Fehlerkomponenten-Modell | 960 |
2.2 Die Schätzverfahren | 960 |
2.3 RE- oder FE-Modell? | 963 |
2.4 Ein Hybrid-Modell | 964 |
2.5 Panel-robuste Standardfehler | 965 |
3 Ein Beispiel: Der Effekt der Heirat auf die Zufriedenheit | 966 |
3.1 Datenaufbereitung | 966 |
3.2 Schätzergebnisse | 968 |
3.3 Ein Modell mit Periodeneffekten | 970 |
3.4 Ein Hybrid-Modell | 971 |
3.5 Ein Wachstumskurven-Modell | 972 |
4 Nicht-lineare FE-Modelle | 973 |
4.1 Nicht-lineare Panelregressionsmodelle | 974 |
4.2 Das FE-Logit Modell | 974 |
4.3 FE-Modelle für Ereignisdaten | 976 |
5 Häufige Fehler | 978 |
5.1 Suboptimale Panelregressionsmodelle | 978 |
5.2 Grenzen von FE-Modellen | 979 |
6 Literaturempfehlungen | 981 |
Literaturverzeichnis | 981 |
37 Survival- und Ereignisanalyse | 983 |
1 Einführung in das Verfahren | 983 |
1.1 Spezifische Problemstellungen | 984 |
1.2 Erhebung von Ereignisdaten | 986 |
1.3 Zensierung von Beobachtungen | 987 |
2 Theoretische Modelle, mathematisch-statistische Grundlagen und Notation | 988 |
2.1 Verschiedene Ratenmodelle und ihre Schätzung | 991 |
Sterbetafelmethode und Kaplan-Meier-Schätzung | 991 |
Das Exponentialmodell | 992 |
Das Cox-Modell | 992 |
Das Piecewise-Constant-Modell | 993 |
Parametrische Modelle der Zeitabhängigkeit | 994 |
2.2 Ein Beispiel | 994 |
3 Modellierung von parallelen und interdependenten Prozessen | 996 |
3.1 Ursachen und zeitabhängige Kovariablen | 997 |
3.2 Zeit und kausale Wirkungen | 998 |
3.3 Zeitachse und Ereignisse | 998 |
3.4 Zeitfolge, Zeitintervalle und scheinbare Gleichzeitigkeit | 998 |
3.5 Zeitliche Form der Entfaltung von Wirkungen | 999 |
3.6 Das Prinzip der konditionalen Unabhängigkeit | 999 |
3.7 Ein Anwendungsbeispiel | 1000 |
4 Häufige Fehler | 1001 |
5 Literaturempfehlungen | 1002 |
Literaturverzeichnis | 1003 |
38 Latente Wachstumskurvenmodelle | 1005 |
1 Einführung in das Verfahren | 1005 |
2 Mathematisch-statistische Grundlagen | 1009 |
3 Beispiel: Entwicklung von Lebenszufriedenheit nach Arbeitsplatzverlust | 1012 |
4 Häufige Fehler | 1014 |
5 Literaturempfehlungen | 1016 |
Literaturverzeichnis | 1016 |
39 Sequenzdatenanalyse | 1018 |
1 Einführung in die Sequenzdatenanalyse | 1018 |
1.1 Was ist Sequenzdatenanalyse? | 1019 |
1.2 Grundlegende Konzepte | 1020 |
2 Mathematisch-statistische Grundlagen: Algorithmen zur Distanzberechnung | 1024 |
2.1 Der Optimal Matching Algorithmus | 1024 |
2.2 Der zweite Schritt: Die Weiterverarbeitung der Distanzen | 1026 |
2.3 Die Diskussion um OM und neuere Entwicklungen | 1026 |
3 Beispiel: Der Arbeitsmarkteintritt westdeutscher Männer und Frauen | 1028 |
3.1 Datenaufbereitung | 1028 |
3.2 Datenauswertung | 1030 |
4 Häufige Fehler | 1035 |
5 Literaturempfehlungen | 1037 |
Literaturverzeichnis | 1037 |
40 Zeitreihenanalyse | 1039 |
1 Einführung | 1039 |
2 Deskription und statistisches Modell | 1041 |
3 Stochastische Prozesse | 1042 |
4 Nichtstationäre (stochastische) Prozesse | 1047 |
5 Tests auf „Random Walk“ | 1049 |
6 Zerlegung von Zeitreihen | 1053 |
7 Interventionsanalyse | 1059 |
8 Ausreißer-Analyse | 1061 |
9 Transferfunktions-Modelle | 1064 |
10 Vektorielle stochastische Prozesse | 1068 |
11 Schluss | 1073 |
12 Literaturempfehlungen | 1074 |
Literaturverzeichnis | 1074 |
Anhang | 1077 |
Autorenverzeichnis | 1078 |