Box 2: Was ist ein Miniaturbild? Was ist Zufallsauswahl?


Was ist ein Miniaturbild?


Die Vorstellung eines Miniaturbildes beinhaltet den Wunsch, daß es sich um eine vergleichsweise kleine Teilpopulation der Grundgesamtheit handeln soll, die deren wesentliche Eigenschaften widerspiegelt. Aber mit diesem unpräzisen Wunsch kommt man nicht weiter. Es muß zuerst spezifiziert werden, was die "wesentlichen Merkmale" sind. Insbesondere kann es sich nicht um Merkmale handeln, die man irgendwann einmal benötigt, aber jetzt noch nicht kennt.

Definition: Sei G eine Population und S eine Teilpopulation. In der Population seien eine Anzahl Merkmale spezifiziert, die sich als Teilmengen der Population beschreiben lassen. Diese Teilmengen werden mit M1, M2,..., Mn und ihre Anteile in der Population mit p1,p2,...,pn bezeichnet.

Eine Teilpopulation S von G heißt Miniaturbild von G bezüglich der Merkmale - oder repräsentativ bezüglich M1, M2,..., Mn - falls diese in der Teilpopulation ebenfalls mit den Anteilen p1,p2,...,pn auftreten.

Wenn man heute feststellt, daß eine Teilpopulation S ein Miniaturbild von G bezüglich bestimmter Eigenschaften ist, dann besteht a priori kein Grund dafür, daß dies in Zukunft auch noch der Fall sein wird oder daß S ein Miniaturbild von G bezüglich weiterer Merkmale ist.

Im allgemeinen wird es ein hoffnungsloses Unterfangen sein, festzustellen, ob eine Teilpopulation S einer Population G ein Miniaturbild bezüglich bestimmter Merkmale ist, es sei denn, man zählt die entsprechenden Teilmengen der Teilpopulation.

Man neigt gelegentlich zur Annahme, daß dies der Fall sein wird, wenn S groß genug ist. Das braucht aber nicht der Fall zu sein. Weder Bayern noch Nordrhein-Westfalen sind Miniaturbilder der Bundesrepublik bezüglich aller demoskopischen Merkmale. Für einige Merkmale besteht Repräsentativität, für andere nicht.


Was ist eine Zufallsauswahl in einer Population G ?


Es besteht bei vielen Anwendern und auch bei Statistikern der Glaube, eine Zufallsauswahl sei eine Teilpopulation, die man mit einem geeigneten Auswahlverfahren aus einer Population gewonnen habe. Diese Vorstellung ist jedoch falsch. Eine Zufallsauswahl ist im Gegensatz zu einem Miniaturbild keine Teilpopulation!

Eine Zufallsauswahl ist ein Auswahlverfahren in einer Population, welches im Prinzip eine Lotterie imitiert.

Wieso kann man nun nicht durch n-maliges Anwenden des Auswahlverfahrens eine Teilmenge der Population erhalten, die man als Zufallsauswahl betrachten kann? Das kann man schon tun, aber die Wahrscheinlichkeitsaussagen der Statistik beziehen sich auf das Auswahlverfahren und nicht auf die ausgewählte Teilmenge.

Es ist genauso sinnlos, von einer Teilmenge der Population zu sagen, sie sei eine Zufallsauswahl, wie von einer einmal gewürfelten Drei zu behaupten, sie sei eine Zufallszahl.

Es gibt viele Auswahlverfahren, jeder trifft täglich Entscheidungen und "wählt damit aus". In der Umgangssprache wird der Begriff des Zufalls häufig mit "unerwartet" oder "willkürlich" in Zusammenhang gebracht. Aber dies hat nichts mit Zufall im statistischen Sinne zu tun. Obwohl die Idee der Lotterie seit Jahrhunderten bekannt ist - schon im alten Ägypten gab es Würfel (auch gefälschte) - wurde der Begriff der Zufallsauswahl erst zu Beginn dieses Jahrhunderts exakt definiert. Die Menschheit hat Statistik und Wahrscheinlichkeitsrechnung seit über drei Jahrhunderten mit unterschiedlichem Erfolg angewendet, ohne über eine präzise Definition des Begriffes "Zufallsauswahl" zu verfügen. Viele falsche Anwendungen und Mißbräuche von Statistik - in diesem, im letzten, vorletzten und nächsten Jahrhundert - beruhen darauf, daß das Auswahlverfahren in der Luft schwebt.

Die Zufallsauswahl wird durch zwei Eigenschaften definiert, nämlich durch die der Chancengleichheit (=Gleichverteilung) und die der Regellosigkeit (=statistische Unabhängigkeit).

  1. Die Chancengleichheit ist leicht zu verstehen: Wird das Auswahlverfahren in einer Population mit N Elementen genügend oft wiederholt, dann muß jedes Element mit ungefähr der relativen Häufigkeit 1/N ausgewählt werden. Die zugrunde liegende Vorstellung basiert auf dem "idealen Würfel", von dem man erwartet, daß jede Seite mit einer relativen Häufigkeit von 1/6 gewürfelt wird, sofern man genügend Ausdauer zeigt....
  2. Die Eigenschaft der Regellosigkeit für Stichproben vom Umfang n kann man sich zwar bildlich noch relativ einfach vorstellen, die Definition ist jedoch nicht leicht zu verstehen: Jede Gruppe von n Elementen in der Population hat die gleiche Chance, ausgewählt zu werden, wenn das Auswahlverfahren n-mal angewendet wird, d.h. bei häufiger n-maliger Auslosung muß jede Gruppe von n Elementen mit einer relativen Häufigkeit von ungefähr 1/ ausgewählt werden.

Die Regellosigkeit der Auswahlverfahren beinhaltet unter anderem, daß ein einmal selektiertes Element der Population keinen Effekt auf das Auswahlverfahren haben darf, insbesondere darf dadurch nicht die Auswahl des nächsten, übernächsten ... Elementes beeinflußt werden.

Auch wenn man beim Würfeln schon zehnmal eine sechs gewürfelt hat, dann wird dadurch die Chance für eine erneute Sechs nicht kleiner und die Chancen für die anderen Seiten nicht größer. Diese Vorschrift geht gegen das (naive) Gefühl. Man neigt zum Glauben, die Chance für eine Sechs sei größer, wenn man lange keine Sechs mehr gewürfelt hat. Umgekehrt erwartet man nach zehnmaligem Würfeln einer Sechs, daß beim nächsten Wurf bestimmt keine Sechs mehr auftreten wird, als sei eine ausgleichende Gerechtigkeit im Spiel.

Nach den Vorstellungen und Wünschen der Meinungsforscher soll die Zufallsauswahl - alias ADM & Quote - dafür geradestehen, daß die repräsentativen Querschnitte Miniaturbilder sind. Aber bezüglich welcher Merkmale? Natürlich für alle, die den Demoskopen je interessieren mögen! Aber das hat die Statistik (bzw. das Gesetz der Großen Zahlen) der Demoskopie nie in Aussicht gestellt. Die üblichen Aussagen beziehen sich auf ein einziges "Ja/Nein"-Merkmal. Dies sei an einem Beispiel erläutert: Angenommen, 52% der Wahlberechtigten seien Frauen. Dann werden bei häufiger Auslosung 95% der Tausender-Querschnitte einen Frauen-Anteil von 49% bis 55% aufweisen, in 5% der Fälle wird sich also ein Frauen-Anteil von über 55% oder unter 49% ergeben. Betrachten wir nun ein weiteres "Ja/Nein"-Merkmal, die Konfession. (Zur Vereinfachung wird angenommen, es gäbe nur Katholiken und Protestanten.) Liegt der Anteil der Katholiken bei 45%, so läßt sich eine analoge Aussage machen. Bei häufiger Auslosung der repräsentativen Querschnitte wird in 95% der Fälle der Katholiken-Anteil zwischen 42% und 48% liegen. Aber daraus kann man nicht schließen, daß bei häufiger Auslosung des repräsentativen Querschnittes in 95% aller Fälle ein Frauen-Anteil zwischen 49% und 55% und ein Katholiken-Anteil zwischen 42% und 48% eintreten wird. Das wird nur in etwa 90% aller Fälle eintreten.

Betrachtet man nun zehn "Ja/Nein"-Merkmale dieser Art in einem repräsentativen Querschnitt, dann wird sich obige Zahl auf 60% reduzieren und bei fünfzig "Ja/Nein"-Merkmalen sogar auf 8%. Mit anderen Worten, bei häufiger Auslosung des repräsentativen Querschnittes wird die gleichzeitige Einhaltung der 95%-Intervalle für die einzelnen Merkmale sehr unwahrscheinlich. Will man eine Sicherheitswahrscheinlichkeit von 95% für zehn bzw. fünfzig bzw. hundert "Ja/Nein"-Merkmale aufrechterhalten, so muß man die Spielräume um über 40% bzw. um fast 70% bzw. um fast 80% vergrößern. Bei einer Sicherheitswahrscheinlichkeit von 90% beträgt die notwendige Vergrößerung der Spielräume über 55% bzw. über 85% bzw. 100%.

Eine analoge Reduktion der Zuverlässigkeit des repräsentativen Querschnittes tritt ein, wenn ein Merkmal nicht zwei, sondern mehrere Ausprägungen hat (wie z.B. verschiedene Parteien, Altersklassen u.s.w.). In den Abschnitten VI bis IX wird darauf näher eingegangen. Zur Aufrechterhaltung einer Sicherheitswahrscheinlichkeit von 95% bei einem Merkmal mit 10 bzw. 50 Ausprägungen sind die Spielräume um über 40% bzw. um fast 70% - im Vergleich zu einem "Ja/Nein"-Merkmal - zu vergrößern. Bei vielen Merkmalen dieser Art ist eine entsprechende Vergrößerung der Spielräume erforderlich.

Die Moral von der Geschichte ist: Je mehr Merkmale in einer "Repräsentativumfrage" untersucht werden und je mehr Ausprägungen die einzelnen Merkmale haben, desto mehr weicht der repräsentative Querschnitt von einem Miniaturbild ab. Man kann also den repräsentativen Querschnitt nicht ungestraft ausquetschen. Je mehr man aus ihm herauszuholen versucht, desto größer wird seine statistische Unzuverlässigkeit. In einer späteren Arbeit wird detailliert auf dieses Phänomen eingegangen.

Die direkte Überprüfung, ob ein Auswahlverfahren die Eigenschaften der Chancengleichheit und der Regellosigkeit aufweise, ist praktisch meist unmöglich. In der Demoskopie ist dies wegen der Größe der Population a priori unmöglich. Der Nachweis, daß ein Auswahlverfahren die Chancengleichheit und die Regellosigkeit verletzt, ist manchmal einfacher.

Die Schöpfer und Verfechter des ADM-Verfahrens und des Quotenverfahrens behaupten von ihren Auswahlverfahren, daß diese den Kriterien der Zufallsauswahl genügen würden. Das bedeutet, daß bei genügend häufiger Wiederholung bei beiden Verfahren in einer Population von ca. 45.000.000 jedes Element mit ungefähr der relativen Häufigkeit 1/45.000.000 in einen repräsentativen Querschnitt gelangen müßte und außerdem jede 1000er-Gruppe gleich oft als repräsentativer Querschnitt ausgewählt werden müßte.

Was das ADM-Verfahren betrifft, so sieht es in der Praxis so aus, daß ein Meinungsforschungsinstitut ausschließlich in den (wenigen) von ihm erworbenen ADM-Netzen seine Befragungen durchführt, wobei aus Kostengründen zunächst einmal stets dasselbe Netz abgegrast wird. Dadurch wird eine Teilpopulation von durchschnittlich 190.000 Wahlberechtigten festgelegt, wobei eine beträchtliche Schwankungsbreite besteht. Bei Wiederholung des Auswahlverfahrens wird der repräsentative Querschnitt stets aus Mitgliedern dieser Teilpopulation zusammengestellt. Alle Wahlberechtigten außerhalb dieser Teilpopulation haben die Chance Null, in den repräsentativen Querschnitt zu gelangen.

Bei Quotenverfahren ist die Situation ähnlich: Die Sample-Points, das heißt die Orte der Befragung, werden einmal festgelegt und werden nicht jedesmal bei der Erstellung eines repräsentativen Querschnittes neu ausgewählt. Die Interviewer werden in den Sample-Points ausgewählt und führen die Interviews an ihrem Wohnort oder in der Umgebung durch (zwecks Kostenersparnis). Durch die Auswahl der Sample-Points und der Interviewer wird ein Wirkungskreis festgelegt, der zu einer Teilpopulation führt, die man - überspitzt formuliert - als "Bekanntenkreis" der eingesetzten Interviewer bezeichnen kann. Bei Erstellung des repräsentativen Querschnittes können daher zwangsläufig nur Mitglieder dieser Teilpopulation selektiert werden. Wahlberechtigte außerhalb dieser Teilpopulation haben also die Chance Null, in den repräsentativen Querschnitt zu gelangen.

In beiden Fällen findet also - wenn überhaupt - eine "Lotterie", das heißt eine Zufallsauswahl, lediglich innerhalb der durch das feste ADM-Netz bzw. den festen Interviewer-Wirkungskreis definierten Teilpopulation statt, nicht aber in der betrachteten gesamten Population. Die Substitution der Gesamtheit durch diese Teilpopulation ist aus praktischen (und finanziellen) Gründen eine Notwendigkeit. Historisch gesehen sind Meinungsumfragen stets auf diese Art durchgeführt worden.

Ob die Teilpopulation ein Miniaturbild für die gesamte Population bezüglich der in der Umfrage behandelten Merkmale darstellen, ob also die gefundenen Ergebnisse auf die gesamte Population übertragen werden können, kann nicht bewiesen werden. Als indirekter "Beweis" sollte allerdings zumindest versucht werden, mit einer ausreichenden Anzahl geeigneter Kontrollmerkmale, deren Verteilung in der Gesamtpopulation bekannt ist, die "Miniaturbild"-Eigenschaft der Teilpopulation zu überprüfen.

Was die Chancengleichheit innerhalb der Teilpopulation betrifft, so scheint diese - jedenfalls auf dem Papier - beim ADM-Verfahren gewährleistet zu sein. Entscheidend sind die Details der Auswahlverfahren in den einzelnen Stimmbezirken (Begehungspläne). Diese werden durch das ADM-Verfahren nicht festgelegt und sind den Instituten überlassen.

Beim Quotenverfahren soll die Chancengleichheit innerhalb der Teilpopulation durch die Quotenvorschriften erreicht werden. Auf den ersten Blick scheint dies hochgradig suspekt. Falls die Ausführungen von Frau Noelle-Neumann betreffend den Kontrollmerkmalen zutreffend sind (Umfragen in der Massengesellschaft, S.136/137,146; Fußnote 30/43), so dürfte eine abgeschwächte Form der Chancengleichheit vorliegen, die statistisch ausreichend erscheint. (Auf die Details kann hier nicht eingegangen werden.) Wesentlich erscheint mir, daß die Anzahl der Befragungen pro Interviewer möglichst klein ist.


Wie sieht es nun in diesen Teilpopulationen mit der Regellosigkeit der Auswahlverfahren aus? Beeinflußt ein einmal ausgewähltes Element der Teilpopulation die Auswahl des nächsten, des übernächsten oder irgendeines anderen Elementes?

Hat wirklich jeder denkbare 1000er-Querschnitt innerhalb eines ADM-Netzes die gleiche Chance, ausgewählt zu werden? Bei dem ADM-Verfahren werden in jedem (!) Stimmbezirk 7-10 Bürger befragt. Alle 1000er-Querschnitte, die sich nicht so zusammensetzen, haben also keine Chance, als repräsentativer Querschnitt ausgewählt zu werden. Dadurch wird die Regellosigkeit verletzt. Durch die Begehungspläne für die Stimmbezirke sind die Interviews statistisch abhängig. Praktikabilität und Kostenersparnis bewirken de facto fast immer eine Verletzung der Regellosigkeit.

Das Quotenverfahren erfüllt die Eigenschaft der Regellosigkeit ebenfalls nicht. De facto werden meist nur Bürger aus dem Wirkungskreis (=Bekanntenkreis) der Interviewer befragt. Durch eine möglichst kleine Anzahl von Befragungen pro Interviewer kann dieser Effekt reduziert werden.

Bei beiden Verfahren hat dies zur Folge, daß ein repräsentativer Querschnitt vom Umfang 1000 nicht wirklich die Information von 1000 unabhängigen Wahlberechtigten liefert, sondern von weniger. Je stärker die Regellosigkeit verletzt wird, desto größer wird der Informationsverlust. Daraus folgt, daß der auslosungsbedingte Spielraum größer wird.



zurück zu "III. Der repräsentative Querschnitt"

weiter zur Box 3: "Simulation der Auslosung des repräsentativen Querschnittes"

weiter zur Box 4: "Kommerzielle Grundlagen vom Meinungsumfragen"

weiter zu "IV. Die 5%-Hürde"

zurück zum Inhaltsverzeichnis

zurück zum Archiv