11. Kategorisieren von qualitativen Daten: Tagging

Sollen qualitative Daten transparent ausgewertet werden, ist ein Zuordnen der Daten (etwa Statements in Textform, Videosequenzen oder Textprotokolle von Verhalten,) in ein Kategoriensystem erforderlich. Mit diesem Kategoriensystem sollen die Daten klassifiziert werden.
Der Prozess des Einpflegens in das Kategoriensystem heißt Kategorisierung oder Tagging.

Zentrale Schritte für das Tagging sind:

  1. Einpflegen der Textstatements in ein Tabellenkalkulationsprogramm (z.B. Excel).
  2. Entwicklung eines Kategoriensystems zum Einordnen der Statements.
    Dieser Schritt wird am besten unabhängig von mehreren Personen parallel durchgeführt, um Objektivität zu gewährleisten. Unterschiede in den entwickelten Systemen werden diskutiert und eine Bestlösung entwickelt.
    Leitlinien bei der Entwicklung des Kategoriensystems sind:

    • Inhaltlich klar abgrenzbare Kategorien.
      Zwischen Kategorien darf möglichst keine inhaltliche Überlappung bestehen.
      Mitunter passiert der Fehler, dass Kategorien aus unterschiedlichen Dimensionen gemischt werden.
      So wären die Kategorien o2, Vodafone, T-mobile, Netzabdeckung und Hotline unsinnig.
      Hier sind Anbieter (o2, Vodafone und T-mobile) mit Dienstleistungsaspekten (Netzabdeckung und Hotline) gemischt.
      Das Statement: “Bei o2 hat mich schon oft genervt, wenn ich unterwegs bin, dass ich kein Netz habe!” könnte hier nicht klar eingeordnet werden.
      Als Lösung bietet sich eine mehrdimensionale Kategorisierung an.
      Die erste Dimension wären die Anbieter. Hier würde das Statement mit “o2” getaggt. In einer Excel-Tabelle würde man hinter die Statements dann eine Spalte mit den Anbietern einfügen und als Symbole beispielsweise o2, V, T, E (E-plus), D (Discounter), S (Sonstige) verwenden.
      Die zweite Dimension wären die Dienstleistungsaspekte. Hier würde das Statement mit “Netzabdeckung” getaggt. In einer weiteren Spalte hinter dem Statement würde man daher z.B. das Kürzel “Nabd” setzen.
    • Sinnvolle Zahl an Dimensionen.
      Im Kategoriensystem sollte keine relevante relevante Dimension ausgelassen werden.
      Nehmen wir an, die Forschungsfrage ist: “Identifikation von Treibern der Kundenzufriedenheit im Mobilfunksektor und Benchmarkder Anbieter.”
      Hier wären die Bewertung durch die Kunden eine wichtige Ergänzung über die reine Identifikation potenzieller Treiber bei den Dienstleistungsaspekten und Zuordnung zu den Anbietern hinaus.
      Als dritte Dimension sollte man entsprechend die Wertung des Statements nehmen.
      Aus den Kategorien “positiv”, “neutral” und “negativ” würde man bei diesem Beispielstatement “negativ” auswählen.
      Ebenso ist meist sinnvoll, weitere Dimensionen zu führen, mit der Bezeichnung der entsprechenden Frage, auf die das Statement kam und der Bezeichnung der Interviewer bzw. Gruppenmoderatoren.
    • Ausreichend ausdifferenzierte Kategorien.
      Die Kategorien sollten keine zu großen Subkategorien bilden – als Faustregel (nach Neumann, 2006) sollte kein Kategorie viel größer als 5% der Statements sein.
      Einerseits könnte in der Dimension Anbieter bei einer Kategorisierung mit o2, Vodafone, T-mobile und Sonstige die Kategorie Sonstige überproportional groß werden. Es sollte also in diese Kategorie geblickt werden, ob sie sich weiter ausdifferenzieren lässt. So könnte es sein, dass auch die Statements zu E-plus und Discountern wie Simyo so zahlreich sind, dass es sich lohnt, eigene Kategorien zu gründen.
      Andererseits kann es ein, dass so wenige Kunden etwas zu Simyo sagen, dass am Ende nur zwei Statements in die Kategorie “Simyo – Netzabdeckung – negativ” fallen. Hier wäre dann sinnvoll, mit anderen Discountern zusammenzulegen oder mehr Personen zu befragen.
    • Vollständige Abdeckung des relevanten Inhaltsbereiches.
      Am Ende einer Kodierung sollten möglichst keine relevanten Statements in der Kategorie ‘Rest’ verbleiben.
      Es empfiehlt sich, diese übrig gebliebenen Statements gründlich durchzulesen, um ggf. noch eine neue bisher nicht beachtete und relevante Kategorie zu entdecken.

     

  3. Zuordnen der Statements zu den Kategorien.
    Auch dies sollte idealerweise parallel durch mehrere Personen unabhängig erfolgen.
    Unterschiede sollten erneut in einer Diskussion geklärt werden.
  4. Weiterentwickeln und Verfeinern des Kategoriensystems im Kodierungsprozess.
    Natürlich wird es eine Menge an Statements geben, die für die Forschungsfrage eher irrelevant sind – aber die inhaltsrelevanten Statements sollten sich gut auf die Kategorien zuordnen lassen.
    Idealerweise wird die Kategorie “Rest” immer kleiner, bis dort kaum mehr als 10% der inhaltsrelevanten Statements sind.
  5. Durchlesen aller Statements in den einzelnen Kategorien, um Fehlzuordnungen zu identifizieren.
    Zunächst sollten dazu alle Statements nach den Kategorien sortiert werden.
    Dann sollte überprüft werden:
    Gehört das Statement wirklich in die zugeordneten Kategorien?
    Ist die Anzahl an Statements in den Kategorien adäquat – es sollen weder zu viele noch zu wenige in einer einzelnen Kategorie sein?

Damit ist die mehrdimensionale Kategorisierung abgeschlossen und die Auswertung je nach Fragestellung möglich.
Bei der Auswertung sind qualitative und durch die Kategorisierung jetzt auch quantitative Methoden einsetzbar.
Differenziertheit der Betrachtung von Kategorien, Häufigkeiten von Nennungen zu Kategorien, positive oder negative Wertungen bei Nennungen, Vergleich über Meinungsgegenstände oder Personengruppen.