Statistische Auswertung

 
Für viele ist die statistische Auswertung der erhobenen Daten eine der größten Hürden ihrer Doktorarbeit. In den letzten Jahren hat die Bedeutung einer fundierten Statistik immer mehr zugenommen und die Zeiten, in denen man durch einige t-Tests eine Auswertung vornehmen konnte, sind endgültig vorbei. Immer häufiger wird eine Doktorarbeit erst gar nicht zum Promotionsverfahren zugelassen, weil das Gremium Fehler bei der Statistik entdeckt oder die Validität der Ergebnisse von vornherein in Frage stellt.
  
Damit Ihnen dies nicht passiert, sollten Sie zunächst einige grundlegende Überlegungen anstrengen.
 
               o   Bestimmung der Verteilungsform
               o   Festlegung, ob unabhängige oder verbundene Stichproben vorliegen
               o   Auswahl des richtigen Testverfahrens
               o   Bestimmung der statistischen Signifikanz
  
o   Bestimmung der Verteilungsform
 
Die Verteilungsform von Stichproben ist für jede Auswertung unentbehrlich, weil von ihr abhängt, welche Testverfahren überhaupt verwendet werden dürfen.
 
                    Normalverteilte Stichproben liegen vor, wenn sich die Messwerte symmetrisch um
                    einen Mittelwert verteilen, so dass das typische Bild einer Gauß`schen Kurve vor-
                    liegt. Ein typisches Beispiel hierfür ist die Altersverteilung in den meisten Industrie-
                    nationen im 20. Jahrhundert.
 
                   Nicht normalverteilte Stichproben liegen dadurch vor, dass sich die Altersverteilung 
                   in den nächsten Jahrzehnten immer weiter zu einem höheren Lebensalter ver-
                   schiebt und gleichzeitig die Geburtenrate immer niedriger wird. Dies bewirkt,
                   dass die Verteilungskurve zunächst nur ganz flach ansteigt, dann steil wird und 
                   nach einem Peak rasch abfällt. In diesem Beispiel liegt keine Normalverteilung 
                   mehr vor. Daraus folgt, dass man zum Vergleich solcher Stichproben nichtpara-
                   metrische Tests verwenden muss.
 
                   Es reicht jedoch nicht aus, nur die Verteilungsform zu kennen, um den richtigen
                   Test auswählen zu können. Zusätzlich muss bekannt sein, ob unabhängige oder 
                   verbundene Stichproben vorliegen.
 
o   Festlegung, ob unabhängige oder verbundene Stichproben vorliegen
 
                   Unabhängige Stichproben haben keine direkte Beziehung zueinander. Beispiel:
                   Es soll überprüft werden, ob Jungen oder Mädchen schneller laufen, daher sollen
                   die Zeiten beim 100 m-Lauf miteinander verglichen werden.
 
                    Verbundene Stichproben liegen vor, wenn Messwerte eines Kollektivs mehrfach
                    bestimmt werden. Die Daten stehen in einer Verbindung zueinander, weil ver-
                    ständlicherweise die Ausgangswerte einen Einfluss auf die Messwerte im Ver-
                    lauf haben. Beispiel: 
                    Bei untrainierten Probanden erfolgt eine Zeitmessung beim 100 m-Lauf. Nach einer
                    Trainingsdauer von 6 Monaten erfolgt eine 2. Messung; es soll herausgefunden 
                    werden, ob die Probanden sich hinsichtlich ihrer Zeiten signifikant verbessert haben.
 
o   Auswahl der richtigen Testverfahren
 
                    Nachfolgend werden die wichtigsten und am häufigsten verwendeten Tests 
                    vorgestellt.
 
                    Kreuztabellen
                    Mit diesem Test wird das Auftreten von bestimmten Merkmalen gegenüber-
                    gestellt. Beispielsweise soll verglichen werden, ob es Unterschiede hinsichtlich
                    des Auftretens von Zahnschmerzen bei Jungen und Mädchen gibt:
 
N = 397

Jungen

Mädchen

Gesamt

Zahnschmerzen

  32

  46

  78

keine Zahnschmerzen

154

165

319

Gesamt

186

211

397

 
                     Aus dieser Tabelle lässt sich berechnen, dass Jungen in 17,2 % der Fälle Zahn-
                     schmerzen angegeben haben, während dies bei 21,8 % der Mädchen zutraf.
 
                     Für Analysen bezüglich einer statistischen Signifikanz kann der Chi-Quadrat-Test
                     verwendet werden.
 
                     Chi-Quadrat-Test
                     Dieser Test überprüft die Unabhängigkeit der untersuchten Variablen der Kreuz-
                     tabelle und somit den Zusammenhang der Merkmale. In obigem Beispiel wird
                     durch den Chi-Quadrat-Test ein p-Wert von 0,12 berechnet, so dass man keinen
                     signifikanten Unterscheid zwischen den beiden Kollektiven nachweisen kann.
      
                     Cave: Um den Chi-Quadrat-Test anwenden zu können, muss das folgende Kriterium 
                     erfüllt sein, sonst besteht eine eingeschränkte Zuverlässigkeit:
 
                     Die erwartete Häufigkeit sollte optimalerweise in keinem Feld < 5 sein, zumindest sollten < 20 %
                     der erwarteten Häufigkeiten < 5 sein! 
 
                     Falls diese Voraussetzung nicht erfüllt ist, gibt es prinzipiell die Möglichkeit, durch
                     Zusammenfassen der Kategorien die Zahl der erwarteten Häufigkeit pro Zelle
                     zu erhöhen. Ob dies in der jeweiligen Studie sinnvoll ist, muss jedoch individuell
                     entschieden werden.
 
                     Vergleich von Stichproben mit kontinuierlichen Messwerten
                     Bei Vergleichen von Stichproben mit kontinuierlichen Messwerten werden je
                     nach Verteilungsform unterschiedliche Tests angewendet. Die nachstehende Ta-
                     bellen geben einen Überblick über die jeweiligen Verfahren.
 
                     Normalverteilte Stichproben
 

Art und Umfang der Stichprobe

Testverfahren

   2 unabhängige Stichproben   t-Test
> 2 unabhängige Stichproben   ANOVA
   2 verbundene Stichproben   t-Test bei gepaarten Stichproben
> 2 verbundene Stichproben   Einfaktorielle Varianzanalyse
 
                     Nicht-normalverteilte Stichproben (nicht-parametrische Tests)
 

Art und Umfang der Stichprobe

Testverfahren

   2 unabhängige Stichproben   U-Test nach Mann und Whitney

  Moses-Test

  Wald-Wolfowitz-Test

> 2 unabhängige Stichproben   H-Test nach Kruskal und Wallis

  Median-Test

   2 verbundene Stichproben   Wilcoxon-Test

  Vorzeichen-Test

> 2 verbundene Stichproben   Friedmann-Test

  Kendalls W

  Cochrans Q

 

o   Bestimmung der statistischen Signifikanz
 
                    Eine statistische Signifikanz liegt vor, wenn der p-Wert kleiner/gleich 0,05 ist.
                    Dies bedeutet jedoch nicht, dass bei einem p-Wert von 0,06, der einen deutlichen 
                    Trend anzeigt,  bereits "alles verloren" ist und die gesamte Promotion als Miss-
                    erfolg zu werten ist. Wenn man ein Kollektiv mit z. B. 50 Patienten und einem
                    p-Wert von 0,07 hat, so kann man sagen, dass trotz des begrenzten Kollektivs ein
                    aussagefähiger Trend erkennbar ist. Weiterhin kann man evt. auch Subanalysen 
                    vornehmen oder Gruppen in den Auswertungen zusammenfassen, so dass man 
                    schließlich doch statistische Signifikanzen erhält.
 
Hilfe bei statistischen Auswertungen
 
Diese Ausführungen sollen einige Tipps geben, wie Fehler vermieden werden können und wie man am besten mit der für seine Doktorarbeit erforderlichen Statistik weiterkommt. Es gibt jedoch eine Unzahl von Fallstricken, die einem erst bewusst werden, wenn man bereits die Fehler gemacht hat. Um dies zu vermeiden, sollte man sich umhören, wer einem bei den statistischen Auswertungen und den Grafiken helfen kann. Oft sind die biometrischen Institute völlig überlaufen, so dass man dann wochenlang auf einen Termin wartet. Im Beratungsgespräch dann zeigt es sich nicht selten, dass die jeweiligen Statistiker nur wenige fachbezogene - z. B. medizinische - Kenntnisse haben und Ihnen daher nicht wesentlich weiterhelfen können.
 
Eine Alternative hierzu bieten professionelle Statistik-Service-Anbieter, bei denen man meist sehr schnell geholfen bekommt. Besonders bei schwierigen und umfangreichen Auswertungen sollte man versuchen, einen Anbieter zu finden, der nicht nur was von Statistik, sondern auch von Ihrem Fachgebiet  versteht. Wenn Sie z.B.  eine medizinische Doktorarbeit schreiben, wählen Sie keinen Anbieter aus, der nicht über ein fundiertes medizinisches Know-How verfügt. So haben Sie die größte Chance, optimale Unterstützung zu erhalten.
 
An dieser Stelle möchte ich auf meinen Statistik-Service aufmerksam machen, mit dem ich ein umfassendes Leistungspektrum unterbreite. Nehmen Sie Kontakt zu mir auf - das erste Gespräch ist prinzipiell kostenlos und gibt bereits erste Ratschläge für das weitere Vorgehen.
 
Hier geht`s zu meinem Statistik-Service:

 

www.statistik-in-der-medizin.de

 

zum Seitenanfang