3. Reliabilität als Gütekriterium

Dieses Kapitel definiert Reliabilität als Gütekriterium, stellt verschiedene Arten der Berechnung von Reliabilität vor und liefert Tipps, wie Reliabilität erhöht werden kann.

Definition von Reliabilität

Wie genau lässt sich Reliabilität definieren? Die Definition von Reliabilität ist:

Reliabilität bezeichnet die Genauigkeit einer Messung.

Egal was man misst, man ist meist daran interessiert ein möglichst genaues Ergebnis zu haben. Wichtig ist, dass hier nur die Genauigkeit gemeint ist, unabhängig davon, ob auch das gemessen wird, was man messen will. Ein Intelligenztest hat also beispielsweise immer die selbe Reliabilität, unabhängig davon, ob man ihn verwenden will Intelligenz zu messen, wofür er konstruiert wurde, oder die Körpertemperatur.

Berechnung von Reliabilität

Reliabilität lässt sich auf verschiedene Arten berechnen.

  • Einmal kann man Reliabilität durch wiederholte Messung des Gleichen erheben, die sogenannte Retest-Reliabilität. So kann man etwa die Intelligenz bei den selben Personen wiederholt messen und aus der Korrelation zwischen den Ergebnissen auf die Genauigkeit des Tests schließen. Dieses Verfahren hat seine Probleme, da Lerneffekte wahrscheinlich sind und sich einige Konstrukte wie Kundenzufriedenheit oder Kundenvertrauen über die Zeit deutlich ändern können; Mitunter schon alleine deshalb, weil Personen wiederholt danach gefragt werden.
  • Um Nachteile von wiederholter Messung zu vermeiden, gibt es statistische Verfahren der internen Konsistenz. So wird bei der Split-Half-Reliabilität (Testhalbierung) der Test bzw. seine Items (Fragen) in zwei künstliche Hälften geteilt, die miteinander korreliert werden. Je höher der Zusammenhang zwischen den Hälften, desto genauer die Messung.
  • Bei der Konsistenzanalyse wird jeweils ein Item mit allen anderen Items korreliert und daraus ein Index berechnet. Die einzelnen Fragen sollten hoch untereinander zusammenhängen, damit der Test genau misst.
  • Eine eher seltene Methode zur Bestimmung der Reliabilität sind Paralleltests. Hierzu müssen zwei Versionen eines Instrumentes (Version A und Version B) mit unterschiedlichen Frageitems erstellt werden. Aus der Korrelation beider Instrumente lässt sich auf die Messgenauigkeit schließen.
Praxistipps

Das nächste Kapitel stellt Validität als Gütekriterium vor.