2. Fehlerquellen bei der Erhebung von Stichproben

Axel Glemser – Head of Sampling, TNS Infratest

„Zum einen gibt es den sogenannten Standardfehler, den jede Stichprobe immer hat. Das ist ein statistisches Maß, was immer existiert, weil wir es mit Stichproben zu tun haben und sie immer eine gewisse Streuung auszeichnet. An der Stelle ist das einfach ein Tatbestand, aber man kann natürlich den Standardfehler über eine Erhöhung der Fallzahl etwas verkleinern. Das wäre das eine Mittel und das andere Mittel ist natürlich bei der Stichprobenziehung ein geschichtetes Verfahren zu verwenden. D.h. die Stichprobe wird in Subpopulationen eingeteilt und man steuert danach die Auswahl. Dadurch kann man besonders kleine Anteile in der Grundgesamtheit stärker berücksichtigen. Das erhöht im günstigsten Fall die Präzision der Mittelwertschätzer. Im ungünstigsten Fall bringt es zwar nichts, verschlechtert aber auch nichts.“

 

Bei der Hochrechnung von der Stichprobe auf die Grundgesamtheit tritt immer der sogenannte Standardfehler – oder auch Zufallsfehler(sampling variability) genannt – auf. Das heißt das Ziehen einer Stichprobe allein führt schon zu fehlerhaften Schätzungen der wahren Werte einer Population. Zufallsfehler sind solche Fehler, die gleichmäßig um einen richtigen Wert streuen. Der Standardfehler ist umso geringer, je größer die Stichprobe ist: “Gesetz der großen Zahlen”.

 

Neben dem Standardfehler gibt es auch die so genannten systematischen Fehler, die bei Stichprobenziehungen auftreten können und zu Ergebnisbeeinträchtigungen führen können. Sie sind einseitige Abweichungen vom wahren Wert und führen entweder zu höheren oder niedrigeren Werten. Systematische Fehler verteilen sich somit im Gegensatz zum Standardfehler nicht gleichmäßig um einen wahren Wert, sondern konzentrieren sich in eine bestimmte Richtung.

 

Systematische Fehler bei der Stichprobenerhebung können durch Untersuchungsträger, Interviewer oder Probanden entstehen.

  • Bei der Planung und Durchführung von Stichprobenerhebungen können Fehler durch den Untersuchungsträger entstehen. Während der Planungsphase kann beispielsweise die Grundgesamtheit falsch definiert werden oder ein ungeeignetes Auswahlverfahren verwendet werden.
    So wird eine Telefonbefragung die Grundgesamtheit in einer geographischen Region nur sehr ungenügend abdecken. Personen ohne Anschluss sind nicht zufällig, sondern haben ganz bestimmte Merkmale (etwa Studentengruppen, die nur noch Mobiltelefone nutzen). Zudem könnten ungünstige Uhrzeiten gewählt werden, an denen vor allem bestimmte Personen erreichbar sind. Problematisch ist zudem, dass bestimmte Personengruppen systematisch schwerer zu erreichen sind, etwa berufstätige oder Personen mit hohem Einkommen.
  • Auch Interviewer stellen eine große Fehlerquelle dar. Der Auswahlplan kann beispielsweise durch Quotenfälschungen verzerrt werden. Hierbei neigt der Interviewer bei den letzten zu suchenden Probanden – mit meist seltener Merkmalsstruktur – zum Selbstausfüllen der letzten Fragebögen, um die vorgegebene Quote zu erreichen. Aber auch Aussehen, Ausstrahlung oder Benehmen des Interviewers können zu unbewussten Beeinflussungen und somit zu Antwortverzerrungen bei Screeningfragen führen und damit zur Aufnahme falscher Fälle. Versucht der Interviewer den Probanden etwa beim Vorbringen der Fragen aktiv – das heißt bewusst zu beeinflussen, spricht man von Suggestion. Selektive und/oder nachlässige Antwortregistrierungen führen ebenfalls zu systematischen Fehlern bei der Stichprobenauswahl durch den Interviewer.
    Um schwarze Schafe unter den Interviewern aufzudecken, werden häufig kleine Gruppen von Personen aus der Stichprobe nochmals angerufen, um zu kontrollieren, ob diese tatsächlich befragt wurden.
  • Auch der Proband kann bewusst oder unbewusst systematische Fehler verursachen.
    Hierzu zählen insbesondere Non-Response – das heißt Kontakt- und/oder Antwortverweigerungen. Diese Fehler gehören zur Gruppe der Selektionseffekte. Non-Response als Verweigerung ist deswegen ein Problem, weil sich die Teilnehmer von den Verweigerern systematisch unterscheiden. Teilnehmer haben so etwa höheres  thematisches Interesse, sind Älter, eher Arbeitslos und haben ein geringeres Einkommen.
    Andere Fehler entstehen unter anderem durch falsches Verständnis der Screeningfragen, bewusste Falschantwort (insbesondere, wenn Teilnehmer etwas erreichen wollen) oder einfach Unwissenheit über den abgefragten Bereich. So übertreiben Personen häufig ihr Einkommen oder ihr Körperpflegeverhalten, um sich sozial besser darzustellen. Weniger akzeptierte Verhaltensweisen, wie Tabakkonsum werden untertrieben oder verschwiegen.