1
Grundbegriffe dermathematischen Statistik
Elementare statistische Berechnungen werden schon seit Jahrtausenden durchgeführt. Das arithmetische Mittel aus einer Anzahl von Mess- oder Beobachtungswerten ist schon sehr lange bekannt.
Zuerst entstand die beschreibende Statistik mit dem Sammeln von Daten etwa bei Volkszählungen oder in Krankenregistern und deren Verdichtung in Form von Maßzahlen oder Grafiken. Die mathematische Statistik entwickelte sich ab Ende des 19. Jahrhunderts aufbauend auf der Wahrscheinlichkeitsrechnung. Anfang des 20. Jahrhunderts gehörten vor allem Karl Pearson und Sir Ronald Aymler Fisher zu ihren Pionieren. Das Buch von Fisher (1925) ist ein Meilenstein, in ihm werden die vom Autor mehrere Jahre zuvor entwickelten Grundlagen der Statistik wie die Maximum-Likelihood-Methode und die Varianzanalyse oder Begriffe wie Suffizienz und Effizienz Versuchsanstellern nahegebracht. Ein wichtiges Informationsmaß heißt noch heute Fisher-Information (siehe Abschn. 1.4).
Wir wollen auf die Details der historischen Entwicklung nicht eingehen und verweisen Interessierte auf Stigler (2000). Stattdessen beschreiben wir den heutigen Stand der Theorie. Wir wollen aber nicht vergessen, dass viele Anregungen aus Anwendungen kamen und bringen deshalb auch immer wieder Beispiele.
Die Wahrscheinlichkeitsrechnung ist zwar die Grundlage der mathematischen Statistik, aber viele praktische Probleme, in denen Aussagen über Zufallsvariablen gemacht werden sollen, sind mit der Wahrscheinlichkeitsrechnung allein nicht zu lösen. Das liegt daran, dass über die Verteilungsfunktion der Zufallsvariablen nicht alles bekannt ist und das Problem oft darin besteht, Aussagen über mindestens einen der Parameter einer Verteilungsfunktion zu machen oder dass sogar die Verteilungsfunktion gänzlich unbekannt ist. Die mathematische Statistik wird in vielen einführenden Texten als die Theorie der Auswertung von Versuchen oder Erhebungen betrachtet, d. h., man geht davon aus, dass bereits eine Zufallsstichprobe (nach Abschn. 1.1) vorliegt. Wie man auf optimalem Weg zu dieser Zufallsstichprobe gelangt, bleibt meist unberücksichtigt – dies wird gesondert in der statistischen Versuchsplanung abgehandelt. In den Anwendungen ist es klar, dass man erst den Versuch (die Erhebung) plant und dann, wenn der Versuch durchgeführt wurde, mit der Auswertung beginnt. In der Theorie ist es aber zweckmäßig, zunächst die optimale Auswertung zu ermitteln, um dann für diese den optimalen Versuchsplan zu bestimmen, z. B. den kleinsten Versuchsumfang für eine varianz-optimale Schätzfunktion. Daher wird hier so verfahren, dass zunächst einmal die optimale Auswertung bestimmt wird und später für diese der Versuchsplan zu erarbeiten ist. Eine Ausnahme bilden dabei die sequentiellen Verfahren, bei denen Planung und Auswertung gemeinsam vorgenommen werden.
Wir müssen uns darüber im Klaren sein, dass es sich bei der Behandlung der mathematischen Statistik einerseits und bei ihrer Anwendung auf konkretes Datenmaterial andererseits um zwei völlig verschiedene Begriffssysteme handelt. In beiden treten oft die gleichen Termini auf, die es genau auseinanderzuhalten gilt. Wir sprechen davon, dass den Begriffen der empirischen Ebene (also denen der Realwelt) Modelle in der Theorie zugeordnet werden.
1.1 Grundgesamtheit und Stichprobe
1.1.1 Konkrete Stichproben und Grundgesamtheiten
In den empirischen Wissenschaften werden ein Merkmal oder auch mehrere Merkmale gleichzeitig (ein Merkmalsvektor) an bestimmten Objekten (oder Individuen) beobachtet. Aus den Beobachtungswerten sind Schlüsse auf die Gesamtheit der Merkmalswerte aller Objekte einer Gesamtheit zu ziehen. Ursache dafür ist, dass es sachliche oder ökonomische Gesichtspunkte gibt, die eine vollständige Erfassung der Merkmale aller Objekte nicht ermöglichen. Hierzu einige Beispiele:
- Die Kosten der Erfassung aller Merkmalswerte stehen in keinem Verhältnis zum Wert der Aussage (z. B. Messung der Körpergröße aller zurzeit lebenden Menschen über 18 Jahren).
- Die Erfassung der Merkmalswerte ist mit der Zerstörung der Objekte verbunden (nicht zerstörungsfreie Werkstoffprüfung wie Reißfestigkeit von Tauen oder Strümpfen).
- Die Gesamtheit der Objekte ist hypothetischer Natur, z. B. weil sie teilweise zum Untersuchungszeitpunkt nicht existieren (wie alle Produkte einer Maschine).
Die wenigen praktischen Fälle, in denen alle Objekte einer Gesamtheit beobachtet werden und auf keine umfassendere Gesamtheit geschlossen werden soll, können wir vernachlässigen, für sie benötigt man die mathematische Statistik nicht. Wir gehen also davon aus, dass aus einer Gesamtheit nur eine Teilmenge ausgewählt wird, um das Merkmal (den Merkmalsvektor) zu beobachten von dem auf die gesamte Population geschlossen werden soll. Einen solchen Teil nennen wir (konkrete) Stichprobe (der Objekte). Die Menge der an diesen Objekten gemessenen Merkmalswerte nennen wir (konkrete) Stichprobe der Merkmalswerte. Jedes Objekt der Population soll einen Merkmalswert besitzen (unabhängig davon, ob wir ihn erfassen oder nicht). Die der Population entsprechende Gesamtheit der Merkmalswerte der Objekte dieser Population nennen wir Grundgesamtheit.
Eine Population und das zu erfassende Merkmal und damit auch die Grundgesamtheit müssen eindeutig definiert sein. Populationen sind vor allem räumlich und zeitlich abzugrenzen. Von einem beliebigen Objekt der Realwelt muss prinzipiell feststehen, ob es zur Population gehört oder nicht. Wir betrachten im Folgenden einige Beispiele:
Population | Grundgesamtheit |
A | Färsen einer bestimmten Rasse | A1 | Jahresmilchmenge dieser Färsen |
| eines bestimmten Gebietes | A2 | 180-Tage-Körpermasse dieser Färsen |
| in einem bestimmten Jahr | A3 | Rückenhöhe dieser Färsen |
B | Bewohner einer Stadt | B1 | Blutdruck dieser Bewohner um 6:00 Uhr |
| an einem bestimmten Tag | B2 | Alter der Bewohner |
Es ist einleuchtend, dass Schlüsse von der Stichprobe auf die Grundgesamtheit falsch sein können. Wenn man z. B. aus der Population B die Kinder einer Kindertagesstätte auswählt, ist möglicherweise der Blutdruck, aber ganz sicher das Alter nicht auf die Population verallgemeinerbar. Generell sprechen wir von Merkmalen, sofern diese aber einen bestimmten Einfluss auf die Versuchsergebnisse haben können, nennen wir sie auch Faktoren, die (meist wenigen) Merkmalswerte heißen dann Faktorstufen, die Kombination von Faktorstufen mehrerer Faktoren heißen Faktorstufenkombinationen.
Hinsichtlich aller Faktoren, die das Merkmal in einer Grundgesamtheit beeinflussen können, sollte die Stichprobe „repräsentativ“ sein. Das heißt, in der Stichprobe der Objekte sollte sich die Zusammensetzung der Population widerspiegeln. Das ist aber bei kleinen Stichproben und vielen Faktorstufenkombinationen gar nicht möglich. In Population B gibt es hinsichtlich der Faktoren Alter und Geschlecht schon etwa 200 Faktorstufenkombinationen, die sich unmöglich in einer Stichprobe von 100 Einwohnern widerspiegeln können. Wir empfehlen daher, den Begriff „repräsentative Stichprobe“ nicht zu verwenden, da er nicht sauber definiert werden kann.
Stichproben sollen nicht danach beurteilt werden, welche Elemente sie enthalten, sondern danach, wie sie erhalten (gezogen) wurden. Die Art und Weise, wie eine Stichprobe erhoben wird, heißt Stichprobenverfahren. Es kann entweder auf die Objekte als Merkmalsträger oder auf die Grundgesamtheit der Merkmalswerte (z. B. in einer Datenbank) angewendet werden. Im letzteren Fall entsteht die Stichprobe der Merkmalswerte unmittelbar. Im ersteren Fall muss das Merkmal an den ausgewählten Objekten noch erfasst werden. Beide Vorgehensweisen (nicht unbedingt die entstehenden Stichproben) sind dann identisch, wenn für jedes ausgewählte Objekt der Merkmalswert erfasst wird. Davon gehen wir in diesem Kapitel aus. In zensierten Stichproben ist das nicht der Fall. Eine Stichprobe heißt zensiert, wenn der Merkmalswert nicht an allen Versuchseinheiten erfasst werden konnte. Bricht man z. B. eine Lebensdauerermittlung (z. B. von elektronischen Bauteilen) nach einer bestimmten Zeit ab, liegen Messwerte für Objekte mit längerer Lebensdauer (als die Beobachtungszeit) nicht vor.
Im Folgenden wird nicht zwischen Stichproben der Objekte und der Merkmalswerte unterschieden, die Definitionen gelten für beide.
Definition 1.1
Ein Stichprobenverfahren ist eine Vorschrift für die Auswahl einer endlichen Teilmenge, genannt Stichprobe, aus einer wohldefinierten endlichen Population (Grundgesamtheit), es heißt zufällig, wenn jedes Element der Grundgesamtheit mit der gleichen Wahrscheinlichkeit p in die Stichprobe gelangen kann. Eine (konkrete) Stichprobe ist das Ergebnis der Anwendung...