11. Praxistipps für skalierte Fragen

In der Praxis steht man bei skalierten Fragen prinzipiell vor mehreren Entscheidungen:
Soll man eine mittlere Alternative verwenden? Welche Anzahl von Stufen ist bei der Skala optimal? Wann sind Skalen mit negativen Werten sinnvoll?

 

Soll eine mittlere Alternative bei Auswahlstufen von skalierten Fragen verwendet werden?

Eine Perspektive geht davon aus, dass die Befragten sich in die eine oder andere Richtung entscheiden sollen und daher eine ungerade Anzahl an Stufen (etwa eine vierer- oder eine sechser-Skala) diese Entscheidung erzwingt. Mit dieser Maßnahme kann nach dieser Auffassung das permanente Ankreuzen der Mitte bei manchen Befragten verhindert werden.
Letztendlich wird in der Praxis zu Recht meist eine ungerade Anzahl an Alternativen verwendet. Was sind die Argumente dafür?
Diese Perspektive argumentiert, dass es bei vielen Aspekten auch eine mittlere Ausprägung gibt und daher auch diese Alternative angeboten werden sollte (etwa in Form einer fünfer- oder einer siebener-Skala).
Zudem erweckt ein Fehlen der mittleren Alternative schnell den Missmut der Ausfüllenden, die einfach keine polarisierte Meinung zu einer Frage haben.
Ein nächster wichtiger Aspekt ist die Interpretation der Daten. Für einen Entscheider in der Praxis ist es sehr wichtig, ob und wie weit Befragte bei einer Alternative von der subjektiven Mitte abweichen. Fehlt diese Mitte, ist die Ergebnisdarstellung (z.B. bei Benchmarks) nicht so anschaulich.
Die Erfahrung zeigt, dass viele Personen sehr differenziert antworten und nicht inflationär die Mitte ankreuzen.
Darüber hinaus ist die mittlere Antwortkategorie in wichtiger diagnostischer Marker, um unseriöses Antwortverhalten zu identifizieren. Einzelfälle zeigen tatsächlich ein extremes Ankreuzen der Mitte. Hier ist es aber wesentlich sinnvoller diese uninformierten oder unmotivierten Personen erkennen zu können und aus dem Datensatz zu entfernen, anstatt durch ein fehlen der Mitte diese wertvolle Information zu verlieren.
Fazit: Alles in Allem spricht daher eine umfangreiche Betrachtung klar für die Verwendung einer mittleren Antwortalternative, d.h. für eine ungerade Zahl an Auswahlalternativen bei skalierten Fragen.

 

Welche Anzahl an Stufen bei skalierten Fragen ist optimal?

Es stellt sich spätestens bei der grafischen Gestaltung eines Bogens mit skalierten Fragen die Frage, welche Anzahl an Abstufungen man verwenden soll.
Auch ohne gerade Anzahl an Kategorien kann man schließlich drei-stufige, fünf-stufige, sieben-stufige oder sogar Fragen mit noch mehr Stufen verwenden. Die Antwort ist hier nicht ganz so simpel, denn es hängt sehr stark am Kontext, in dem eine Frage Verwendung findet.
Kurz gesagt:

Eine drei-stufige Skala ist meist zu undifferenziert. Sie sollte eingesetzt werden, wenn der gemessene Aspekt sehr undifferenziert ist, nur eine grobe Richtung interessiert oder die geistigen Fähigkeiten der Zielgruppe sehr eingeschränkt sind.

Eine fünf-stufige Skala ist wesentlich differenzierter und für die meisten Personen noch sehr leicht verständlich. Befragte können sich bei einer fünfer Skala schnell orientieren. Auch längere Blocks mit Fragen ermüden nicht, man findet sehr schnell die entsprechenden Kästchen.

Ab sieben Stufen wird die schnelle Orientierung schwieriger, die Befragungen ermüden schneller.
Soll aber

  • sehr genau gemessen werden,
  • ist die Befragung kurz,
  • die geistigen Fähigkeiten,
  • das für die Befragung relevante Wissen,
  • und die Motivation der Zielgruppe hoch,

dann kann eine sieben oder sogar noch höher stufige Skala durchaus sinnvoll sein.
Auch wenn ein wesentlicher Aspekt nur mit einer einzigen Frage abgedeckt wird und Korrelationen mit anderen Fragen berechnet werden sollen, ist eine siebener Skala vorteilhaft, denn: je weniger Kategorien zur Messung verwendet werden, desto niedriger die resultierenden Korrelationskoeffizienten bei der Auswertung.
Erfahrungsgemäß können bei einer siebener Skala die verbalen Verankerungen extremer als bei einer fünfer Skala sein: beispielsweise “trifft voll zu” statt “trifft zu” und “trifft überhaupt nicht zu” statt “trifft nicht zu”.

Auch Skalen oberhalb von sieben Stufen bis hin zu kontinuierlichen Skalen können sinnvoll sein.
Sollen etwa Wahrscheinlichkeiten in Prozent angegeben werden (“Wie wahrscheinlich ist es, dass Sie Event Y besuchen werden?”), kann in Onlinebefragungen ein Schieberegler mit 101 Abstufungen von Null bis 100 sinnvoll sein.

Fazit: Als Conclusio kann die fünfer Skala als bewährter Standard gelten, so lange nicht genannte Rahmenbedingungen dagegen sprechen. In diesen Fällen wird vereinzelt abgewichen.
So sollte ein Fragebogen idealerweise hauptsächlich fünfer Skalen beinhalten, bei einzelnen Fragen aber durchaus auf andere Formate wechseln.

 

Wann sollten Skalen mit teilweise negativen Werten verwendet werden (symmetrische Skalen)?

Viele Skalen gehen von “trifft überhaupt nicht zu” bis “trifft voll und ganz zu”. Man kann auch nicht negativ vorhaben ein Produkt zu kaufen, eine Sache als negativ wichtig beurteilen oder negativ Vertrauen haben. Hier macht es keinen Sinn negative Zahlen zu verwenden, schadet sogar den Ergebnissen.
Bei anderen Fragen können dagegen negative Skalenwerte durchaus sinnvoll sein. Soll eine Abweichung von einem Ideal angegeben werden oder ein Unterschied zum Wettbewerber (besser oder schlechter), dann ist ein negativer Pol sehr sinnvoll.
Meist werden Fehler hier bereits in Pretests aufgedeckt, da die Befragten sich explizit wundern, unpassende, auffällige oder keine Antworten angeben.
Fazit: Skalen mit negativen Kategorien sollte man nur dort verwenden, wo der beurteilte Meinungsgegenstand wirklich in den negativen Bereich gehen kann.