Cover | 1 |
Zum Inhalt_Autor | 2 |
Titel | 3 |
Vorwort | 4 |
Inhaltsverzeichnis | 5 |
1 Einführung | 8 |
1.1 Eine Vorbemerkung zu R | 8 |
1.2 Arbeitsumgebung | 10 |
1.3 Die Bedienung von R | 10 |
1.4 R-Objekte | 13 |
1.4.1 Typen | 13 |
1.4.2 Typen- und Klassenänderung | 15 |
1.4.3 Datenfelder: data.frame | 16 |
Vergabe von Variablennamen | 17 |
Unterobjekte und die Verwendung von Indizes | 17 |
Datenfelder und Faktoren | 19 |
Suchpfade | 20 |
1.5 Zusätzliche Pakete | 21 |
1.6 Hilfe, Manuals und Mailinglisten | 21 |
2 Rechenoperationen und Programmablauf in R | 24 |
2.1 Operatoren und mathematische Funktionen | 25 |
2.1.1 Logische Operatoren | 25 |
2.1.2 Mathematische Funktionen | 26 |
2.1.3 Mengenoperationen | 27 |
2.1.4 Vektorisierte Funktionen | 28 |
2.1.5 Spezielle Vektorfunktionen | 29 |
2.1.6 Matrixoperationen | 29 |
2.1.7 Rechengenauigkeit und Rundungsfehler | 30 |
2.1.8 Operationen mit Texten | 31 |
2.1.9 Sequenzen und Wiederholungen | 31 |
Sequenzen | 31 |
Wiederholungen | 32 |
2.2 Programmablauf | 33 |
2.2.1 Funktionen | 33 |
2.2.2 Schleifen | 34 |
2.2.3 Vermeidung von Schleifen | 35 |
apply | 35 |
lapply | 36 |
sapply | 37 |
mapply und Map | 37 |
tapply und by | 37 |
split und unsplit | 38 |
2.2.4 Bedingte Anweisungen | 39 |
2.3 Übungsaufgaben | 40 |
3 Datenspeicherung und Austausch von Daten | 42 |
3.1 Dateien und Datenspeicherung | 42 |
3.1.1 Datenerfassung | 42 |
3.1.2 Datenspeicherung | 43 |
3.1.3 Übergabe von Daten an andere Programme | 44 |
3.1.4 Dateien und Pfade | 45 |
3.1.5 Dateien im Internet | 46 |
3.2 Dateien anderer Statistikprogramme | 46 |
3.2.1 SPSS, Stata und Co | 46 |
3.2.2 Label | 47 |
3.2.3 Zusätzlich definierte fehlende Werte | 50 |
3.2.4 Datenaustausch mit Excel | 51 |
3.3 Übungsaufgaben | 52 |
4 Datenauswahl und Datentransformation | 54 |
4.1 Datenauswahl und Zusammenführung | 54 |
4.1.1 Auswahl von Fällen und Variablen | 54 |
Variablenauswahl | 54 |
Auswahl bestimmter Beobachtungen | 56 |
subset | 56 |
4.1.2 Verbinden von Datensätzen | 57 |
rbind und cbind | 57 |
do.call | 58 |
4.1.3 Daten sortieren | 59 |
4.1.4 Daten zusammenführen | 61 |
4.2 Transformationen und Rekodierungen | 62 |
4.2.1 Transformationen | 63 |
4.2.2 Rekodierung | 65 |
4.2.3 Rekodierung von Faktoren | 66 |
recode | 67 |
4.3 Übungsaufgaben | 68 |
5 Datenbeschreibung: Eine Variable | 69 |
5.1 Verteilungs- und Quantilsfunktion | 69 |
5.1.1 Urliste | 69 |
5.1.2 Häufigkeitsverteilung | 71 |
5.1.3 Verteilungsfunktion | 72 |
5.1.4 Quantilsfunktion | 73 |
5.1.5 Boxplots | 74 |
5.2 Mittelwerte, Varianzen und Momente | 75 |
5.2.1 Varianz und Standardabweichung | 75 |
5.3 Histogramme und Dichten | 76 |
5.3.1 Histogramme | 77 |
5.3.2 Dichteschätzer | 79 |
5.4 Übungsaufgaben | 81 |
6 Datenbeschreibung: Mehrere Variablen | 83 |
6.1 Mehrdimensionale relative Häufigkeiten | 83 |
6.2 Tabellen | 84 |
6.2.1 table und ftable | 84 |
6.2.2 margin.table und xtabs | 86 |
6.2.3 addmargins | 88 |
6.2.4 Graphische Darstellungen | 88 |
6.3 Dichteschätzer | 89 |
6.4 Kovarianzen und Korrelationen | 91 |
6.5 Bedingte Verteilungen | 93 |
6.5.1 Bedingte Verteilungen und Simpsons Paradox | 94 |
spineplot | 95 |
6.5.2 Bedingte Dichten | 95 |
6.6 Übungsaufgaben | 98 |
7 Grundlagen der Simulation | 99 |
7.1 Zufallszahlen? | 99 |
7.2 Gleichverteilung | 101 |
7.2.1 Monte-Carlo-Integration | 102 |
7.2.2 Integrale und Erwartungswerte | 103 |
7.2.3 Endliche Gleichverteilung und Periode | 105 |
runif | 106 |
Andere Generatoren | 107 |
7.2.4 Startwerte | 108 |
7.3 Zufallszahlen mit vorgegebener Verteilung | 109 |
7.4 Parametrisierung der Verteilungsklassen | 110 |
7.5 Stichproben und Tabellen | 111 |
7.6 Funktionen von Zufallsvariablen | 112 |
7.7 Übungsaufgaben | 115 |
8 Stochastische Modelle | 118 |
8.1 Das Standardmodell der Statistik | 118 |
8.1.1 Mittelwert oder Median? | 119 |
8.1.2 Warum n – 1? | 121 |
8.1.3 Kann man Erwartungswerte schätzen? | 122 |
8.1.4 Bootstrap und Bagging | 124 |
8.2 Markow-Ketten | 126 |
8.3 Übungsaufgaben | 131 |
9 Lineare Regression | 134 |
9.1 Grundlagen | 134 |
9.2 Lineare Modelle in R | 136 |
9.2.1 Der lm Befehl | 136 |
9.2.2 Formeln für Regressionen | 139 |
9.2.3 Modellvergleiche und fehlende Werte | 142 |
9.2.4 Diagnostik | 143 |
9.2.5 Ausschluss von Ausreißern | 148 |
9.2.6 Transformation der abhängigen Variablen | 150 |
9.2.7 Transformationen der Kovariablen | 153 |
9.3 Regression in Matrixnotation | 157 |
9.3.1 Einfache Matrixoperationen in R | 158 |
9.3.2 Das Regressionsmodell in Matrixnotation | 161 |
9.3.3 Die Berechnung von Regressionen in R | 162 |
9.4 Übungsaufgaben | 164 |
10 Die Maximum-Likelihood-Methode | 166 |
10.1 Die Leitidee | 166 |
10.2 Maximum-Likelihood-Schätzung | 167 |
10.2.1 Maximum-Likelihood: Binomialverteilung | 167 |
10.2.2 Maximum-Likelihood: Poisson-Verteilung | 170 |
10.2.3 Maximum-Likelihood: Normalverteilung | 171 |
10.3 Gütebeurteilung von ML-Schätzern | 173 |
10.3.1 Likelihoodquotienten | 173 |
10.3.2 Eine Daumenregel für den Likelihoodquotienten | 174 |
10.3.3 Fisher-Information | 175 |
10.3.4 Beispiel Binomialverteilung | 177 |
10.4 Übungsaufgaben | 179 |
11 Optimierung, Logit-, Probit-, Poisson-Regression | 180 |
11.1 Numerische Optimierung | 180 |
11.1.1 Der Newton-Raphson-Algorithmus | 182 |
11.1.2 Der Befehl optim() | 184 |
11.1.3 Der Befehl maxLik() | 185 |
11.2 Verallgemeinerte Lineare Modelle | 186 |
11.3 Logit- und Probit-Regression | 186 |
11.3.1 Maximum-Likelihood-Schätzung | 188 |
11.3.2 Logit- und Probit-Regression mit R | 189 |
11.3.3 Probit- und Logit-Regression mit glm() | 191 |
11.4 Poisson-Regression | 193 |
11.4.1 Poisson-Regression mit R | 194 |
11.4.2 Poisson-Regression mit glm() | 196 |
11.5 Übungsaufgaben | 196 |
12 Stichproben | 198 |
12.1 Stichproben aus endlichen Grundgesamtheiten | 198 |
12.1.1 Die grundlegende Problemverschiebung | 200 |
12.1.2 Stichprobendesign | 200 |
12.1.3 Der Inklusionsindikator | 201 |
12.1.4 Inklusionswahrscheinlichkeiten | 203 |
12.2 Einfache Stichprobenziehung mit R | 205 |
12.2.1 Gesamtheit und mögliche Stichproben | 205 |
12.2.2 Ermittlung der Inklusionswahrscheinlichkeiten | 206 |
12.2.3 Horvitz-Thompson-Schätzer | 208 |
12.2.4 Die Varianz des Horvitz-Thompson-Schätzers | 209 |
12.2.5 Schätzung der Varianz | 210 |
12.3 Schichtenverfahren | 213 |
12.3.1 Mittelwert- und Varianzschätzung | 213 |
12.3.2 Schichtenverfahren in R | 214 |
12.4 Klumpenverfahren | 216 |
12.4.1 Mittelwert- und Varianzschätzung | 216 |
12.4.2 Klumpenverfahren in R | 218 |
12.5 Übungsaufgaben | 220 |
13 Ansprechende Graphiken | 222 |
13.1 Die Elemente der Standardgraphik | 222 |
13.1.1 Der Befehl plot() | 224 |
13.1.2 Optionen des plot() Befehls | 225 |
Zusätzliche Graphikelemente | 225 |
13.1.3 Stilparameter par() | 228 |
Aufteilung der Graphikregion | 229 |
Lage der Beschriftungen | 231 |
Größe der Beschriftungen | 231 |
Fontauswahl | 232 |
Darstellungsbereich | 233 |
13.1.4 Mathematische Annotation | 233 |
Ein Beispiel | 234 |
13.1.5 Farben | 235 |
Farbpaletten | 236 |
Alternative Farbpaletten | 236 |
13.1.6 Ausgabeformate und Devices | 238 |
Deviceverwaltung | 238 |
Ausgabeformate | 239 |
Arbeiten mit mehreren Devices | 242 |
13.2 Sprachen, Encodings und Fonts | 243 |
13.2.1 Sprachen und Encodings | 243 |
13.2.2 Fonts | 246 |
14 Tipps und weitere Möglichkeiten | 250 |
14.1 Alternative Graphikmodelle, D-Graphiken | 250 |
14.1.1 Weitere nützliche Devices | 250 |
pictex, xAg und tikzDevice | 250 |
Cairo und cairoDevice | 251 |
14.1.2 Andere Graphiksysteme in R | 252 |
Trellis Graphiken | 252 |
Grammar of Graphics | 256 |
14.1.3 3D-Graphiken | 260 |
14.2 Große Datensätze und Datenbanken | 261 |
Verzeichnis der Befehle und Funktionen | 264 |
Verzeichnis der Pakete | 268 |
Sachverzeichnis | 269 |
Impressum | 274 |