X Die Gewichtung

Aufgrund von Fehlprognosen haben die Meinungsforschungs-Institute in den letzten Jahren zu einem ebenso riskanten wie dubiosen Mittel gegriffen; der "Kunst" der Gewichtung. Es werden nicht die tatsächlichen Umfrageergebnisse veröffentlicht, sondern diese werden rein rechnerisch erhöht oder erniedrigt, und nur dieses modifizierte Resultat wird publiziert.

M. Kaase führte dazu im "Rheinischen Merkur" Nr.37/1987 aus:

"Wegen ..... Verzerrungsmöglichkeiten hat die kommerzielle Wahlforschung das Verfahren der "politischen Gewichtung" erfunden. Bei diesem höchst umstrittenen und theoretisch völlig unfundierten Ansatz macht man sich paradoxerweise gerade die Abweichung der Befragtenangaben zu ihrer zurückliegenden Wahlentscheidung (der sogenannten Recall-Frage) vom ja zweifelsfrei bekannten Ergebnis einer zurückliegenden Vergleichswahl zunutze, um die aktuelle "Prognose", die an sich auf den Angaben der Befragten zu ihrer Wahlabsicht beruhen müßte, zu korrigieren. Solche politisch gewichteten "Prognosen" haben die Wirkung, diese mehr in die Nähe der traditionell zu erwartenden Wahlergebnisse zu rücken und verfälschen damit gerade die eigentlich interessante Nachricht : Wie nämlich zu einem bestimmten Zeitpunkt die Stimmung der Bevölkerung bezüglich der politischen Parteien aussieht."

Ein typisches Beispiel für die Umverteilung von Prozenten, wie sie vor der Bundestagswahl praktiziert wurde, war in der Wirtschaftswoche Nr. 1/2 vom 2. Januar 1987 dargestellt:

"Behaupten etwa zu viele Befragte, sie hätten beim letztenmal sozialdemokratisch gewählt, so wird das aktuelle Umfrageergebnis für die SPD entsprechend heruntergewichtet. Liegt der Erinnerungswert für die FDP zu niedrig, werden die Liberalen entsprechend hochgewichtet: Deren aktueller Recall-Zuschlag liegt bei rund 100 Prozent."

Es wird oft behauptet, die erfragten Werte für die SPD und die Grünen müßten erniedrigt und diejenigen für die FDP erhöht werden. Als Gründe dafür werden angeführt, daß ein Teil der SPD- und Grüne-Wähler "erfahrungsgemäß" bis zum Wahlsonntag "ihre Meinung ändern" oder daß diese auf Grund von systematischen Verzerrungen in der Repräsentativumfrage überproportional vertreten seien. Von der FDP wird behauptet, sie würde "erfahrungsgemäß" am Wahltag Zweitstimmen von CDU/CSU-Wählern erhalten und sie sei in Repräsentativumfragen systematisch untervertreten.

Falls es sich um empirisch gesicherte Erkenntnisse und nicht um plausible Stammtisch-Argumente handelt, können solche Modifikationen sinnvoll und nützlich sein, soweit sie der Korrektur systematischer Fehler dienen. Aber es ist absurd, auslosungsbedingte Abweichungen, die einen großen Spielraum unvermeidlich machen (vergleiche Abschnitte IV bis IX), durch Gewichtung kompensieren zu wollen. Dies wird aber gerade in der Praxis routinemäßig gemacht.

Die Größenordnung der Umgewichtung ist atemraubend. Nach Noelle-Neumann werden die tatsächlich ermittelten Ergebnisse bis zu 10% oder 11% abgeändert.^, Wie vorhin erwähnt, betrug im Januar 1987 der "aktuelle" Recall-Zuschlag für die FDP rund 100%, d.h. das Umfrageergebnis wurde verdoppelt. In den Graphiken auf den Seiten X/5 bis X/7 ist die von der Forschungsgruppe Wahlen im Politbarometer des ZDF vorgenommene Umgewichtung in den Jahren 1986/87 detailliert dargestellt.

Die Meinungsforschungs-Institute schaffen sich durch die Gewichtung einen Freiraum, von dessen Existenz und Ausmaß die Öffentlichkeit keine Ahnung hat.

Ein seriöses Institut sollte auf das Gewichtungsdilemma und die Interview-Fehler hinweisen und wenigstens den auslosungsbedingten Spielraum der Umfragenergebnisse angeben. Es sollte die Rohdaten offenlegen und nicht nur Zahlen, die es daraus durch eine geheimgehaltene Kosmetik gewinnt.

Das geschieht jedoch nicht. Die einzige Ausnahme ist meines Wissens die Forschungsgruppe Wahlen - d.h. das Politbarometer im Zweiten Deutschen Fernsehen - wo die Existenz und das Ausmaß der Abänderung von Umfrageergebnissen noch in Umrissen erkennbar ist. Die Forschungsgruppe Wahlen hatte sich stets gegen die Gewichtung von Umfragenergebnissen gewehrt. Anfang 1986 wurde sie durch politischen Druck gezwungen, diese dubiosen Praktiken ebenfalls einzuführen und zu kaschieren. Die Details dieser Aktion und die Begründung für diese angebliche "Erweiterung" der Berichterstattung sind in der Box auf Seite X/8 zu lesen.

Für die folgenden Ausführungen halte man sich die Tabellen auf den Seiten X/5 bis X/7 vor Augen, in welchen die Umgewichtungen graphisch dargestellt sind. Die Einführung der Gewichtung beim Politbarometer im März 1986 führte zu einer Erhöhung der Prozentzahlen für die Union bzw. die FDP um durchschnittlich etwa 1,5% bzw. 3% im Jahre 1986. Die Umfrageergebnisse für die SPD bzw. die Grünen wurden um durchschnittlich etwa 3% bzw. 2% nach unten korrigiert. Bei diesen Zahlen handelt es sich um Durchschnittswerte, die Bandbreite der Umgewichtung ist beträchtlich. Die Gewichtung zeigte bei den großen Parteien einen deutlichen zeitlichen Trend. Anfang des Jahres wurde die SPD massiv beschnitten, während die Union ein kräftiges "face lifting" erhielt: im März -9% für die SPD und +6% für die Union. Im Sommer - Juni bis September - reduzierte sich der Aderlaß der SPD auf 2% bis 4%, während die CDU/CSU zunehmend "selbständiger" wurde. Im Oktober stand die Union auf eigenen Füßen, und die SPD mußte nur noch die bescheidene Abgabe von einem Prozent entrichten. Im Oktober/November erfolgte dann eine eigentliche Kehrtwendung bei der Gewichtung : Man erinnere sich an die damalige Situation. Die November-Umfrageergebnisse des Politbarometers, welche Anfang Dezember die Wahlkampfarena erreichten, ergaben 49% für die Union, 37% für die SPD, 4% für die FDP und 10% für die Grünen. Damit wäre die FDP wie üblich - d.h. wie bei den meisten Politbarometerumfragen 1986 - an der 5%-Hürde gescheitert und die Union hätte folglich mit 49% die absolute Mehrheit errungen. Bekanntlich erhitzte diese Möglichkeit die Gemüter erheblich. Die CDU/CSU lief Sturm gegen das "Gerede von der absoluten Mehrheit", gleichzeitig aber führte sie eine vehemente Zweitstimmenkampagne gegen die FDP mit der Begründung, die FDP benötige keine Leihstimmen der Union, denn sie sei sicher über der 5%-Hürde.

In dieser Situation änderte das Politbarometer seine bisherige Gewichtungs-Praxis bei den großen Parteien. Zum ersten Mal wurden Prozente von der CDU/CSU zur SPD hin verschoben; der Anteil der Union wurde von 49% auf 47% reduziert, während die SPD eine Mutspritze von 37% auf 38% erhielt. Der Anteil der FDP wurde von 6% im Vormonat auf 7% erhöht, obwohl das zugrundeliegende Umfrageergebnis unverändert bei 4% lag. Durch diese Änderung der bisherigen Gewichtungs-Praxis lieferte das Politbarometer - was zweifellos unbeabsichtigt war - den "wissenschaftlichen Beweis" für die Wahlkampfbehauptungen der Union.

Das Verschweigen der Gewichtungen kann handfeste politische Auswirkungen haben. Ist es zum Beispiel zu verantworten, der FDP Monat für Monat 6% bis 7% auf den Bildschirm zu projizieren, obwohl ihr bei den laufenden Umfragen ermittelter Zweitstimmenanteil deutlich unter 5% liegt?

Mit diesen Zahlen wird doch dem Wähler suggeriert, die FDP sei sicher über der 5%-Hürde. Wer garantiert aber, daß die Wähler am Wahlsonntag für die "aus Erfahrung" hinzugerechneten 2% tatsächlich aufkommen? Etwa die Gewichtungs-Zauberlehrlinge?

Es mag sein, daß die Stärke der FDP und der CDU/CSU mit Umfrageergebnissen in der Vergangenheit nicht selten unterschätzt worden sind. Ein Wahlforscher hat das Recht, wahrscheinlich sogar die Pflicht, darauf hinzuweisen.

Aber hat er das Recht, der Öffentlichkeit die Unzulänglichkeiten seiner Meßmethoden mit gefälschten Zahlen zu verheimlichen?

Bei Abänderungen der Rohergebnisse in den dargelegten Dimensionen stellt sich die Frage, weshalb überhaupt noch Meinungsumfragen für Wahlprognosen durchgeführt werden. Weshalb legt das Meinungsforschungsinstitut xy nicht einfach die Hand für einen Unionsanteil von x% ins Feuer? Seit den fünfziger Jahren schwankte die CDU/CSU bei den Bundestagswahlen bekanntlich zwischen etwa 45% und 50%, und dazwischen liegen nicht allzuviele Prozentzahlen, die als Prognosewert in Frage kommen .... Wie in Abschnitt VII gezeigt wurde, ist der auslosungsbedingte Spielraum größer.

Daß es auch "richtige" Prognosen gibt, liegt zu einem guten Teil an der politischen Stabilität der Bundesrepublik und an den statistisch unvermeidlichen "Zufallstreffern". Wenn die politische Landschaft in Bewegung geriete, würden den Wahlforschern die Felle sehr bald für jedermann sichtbar davonschwimmen. Einen Vorgeschmack für dieses Szenario lieferten etwa die Landtagswahlen in Bremen im September 1987: Die Form der im Zweiten Deutschen Fernsehen präsentierten Prognose,

CDU unter 30%

drückt so grotesk wie nur möglich das Eingeständnis aus, daß in einer neuen Situation nur nichtssagende Prognosen "sicher" sind. Man traut den eigenen Daten nicht mehr, weil sie den bisherigen Rahmen sprengen. Das Wahlresultat - 23,4% für die CDU, ein Verlust von 10% gegenüber 1983 - bestätigte die dumpfen Ahnungen der Forschungsgruppe Wahlen.

Bei großen Veränderungen - z.B. ±10% bis ±20% - werden die Karten neu verteilt. Dann müßten völlig unbekannte Größen gemessen werden, für deren Abschätzung es keine Präzedenzfälle gibt. Da reicht es nicht mehr aus, vom letzten Wahlresultat Pi mal Daumen ein paar Prozente abzuziehen oder zu addieren. Nun muß der Wahlforscher eine Aussage machen, von der er weiß, daß er sich damit wahrscheinlich in die Nesseln setzen wird.

In einer solchen Situation werden wir Zeuge einer bisher in der Zoologie nicht beobachteten Metamorphose: Unsere Politwetterfrösche werden aufgeschreckt aus ihrem seichten Teich hüpfen und als ratlos schnatternde Enten über dem Sumpf der Demoskopie flattern. Jeder fühlt sich allein - und von seinen Daten im Stich gelassen. Die Statistik hilft ihm nicht, sich aus der Schlinge zu ziehen, in die er sich durch unhaltbare Versprechen verstrickt hat. Denn es treten - wie in den Abschnitten IV bis IX gezeigt wurde - als Folge der Auslosung des repräsentativen Querschnittes Abweichungen in einer Größenordnung auf, die der Meinungsforscher vor der Öffentlichkeit nicht eingestehen kann und will. So bleibt ihm als einziger Orientierungspunkt das Spektrum der "Prognosen" der Konkurrenz. Die treibende Kraft ist die Angst, möglicherweise als einziger völlig daneben zu liegen. Zum Glück gibt es da die Gewichtung, mit deren Hilfe es möglich wird, die eigene Prognose im Mittelfeld der "Gerüchtebörse", d.h. der "Konkurrenz"-Prognosen, anzusiedeln. Wenn die Sache schiefgeht, dann war man wenigstens nicht allein, was für das umsatzmäßig dominante und daher langfristig lebenswichtige kommerzielle Alltagsgeschäft von Bedeutung ist.

Eine Konsequenz dieser Angleichung (d.h. Koppelung) von Umfrageergebnissen - die manchmal auch bei normalen Änderungen des politischen Kräfteverhältnisses zu beobachten ist - besteht darin, daß die Fehler in der gleichen Richtung auftreten. Beispielsweise schätzen "alle" Institute die CDU/CSU zu hoch oder "alle" zu tief ein. Wenn der Zufall zu seinem Recht kommen würde, dann wären Fehler dieser Art extrem unwahrscheinlich.

Auch beim zeitlichen Verlauf der Parteistärken wird der Zufall vergewaltigt. Wenn z.B. im "Spiegel" Nr. 45/1987 eine Graphik von Emnid abgedruckt ist, in welcher der CDU/CSU von Februar bis Juli 1987 konstant 44% zugeschrieben wird - und ebenso der FDP konstant 10% von Mai bis Oktober 1987 - dann handelt es sich um getürkte (d.h. geglättete bzw. gewichtete) Zahlen. Der Zufall mag ja seine Launen haben, aber so etwas schafft er nicht!

weiter zu Box 16: "Graphische Darstellung der Gewichtung des Politbarometers"

weiter zu Box 17: "Wie das Politbarometer zur Gewichtung verdonnert wurde"

weiter zu Box 18: "Spieglein, Spieglein an der Wand ..."

weiter zu "XI. Schlußfolgerungen"

zurück zu "IX. Der zeitliche Trend über mehrere Monate"

zurück zum Inhaltsverzeichnis

zurück zum Archiv