Basiswissen Medizinische Statistik - Musterkapitel [original]

Vorwort V

Vorwort

Es gibt keine gute Medizin ohne Biostatistik. Dieser Satz wird

bei den meisten Medizinstudenten auf Unverständnis stoßen.

Warum ist es wichtig, als Mediziner sich mit Biostatistik zu befas-

sen? Das ärztliche Handeln muß auf Wissen basieren. Alles andere

ist Scharlatanerie – auch wenn es mit gutem Gewissen und in be-

ster vorgebracht wird. Neues Wissen in der Medizin kann nur un-

ter Kenntnis und Anwendung von statistischen Methoden gewon-

nen werden. Sonst verfallen wir Zufällen und Halbwahrheiten, die

auch dann nicht besser werden, wenn sie mantrahaft wiederholt

werden.

Ist Biostatistik unattraktiv? Keineswegs – es gibt sogar Medizi-

ner, die Biostatistik faszinierend finden. Erst damit ist es möglich,

Forschungsergebnisse (auch eigene) zu verifizieren und zu bewer-

ten. Der schlechte Ruf, der diesem Fach vorauseilt, ist dadurch be-

gründet, daß statistische Methoden auf mathematischen Formeln

basieren, die für viele mathematikgeschädigte Mediziner ein

Greuel sind. Als Anwender muß man diese Formeln jedoch nicht

herleiten können oder auswendig lernen. Man sollte vielmehr ver-

stehen, wie statistische Methoden sinnvoll in der Medizin ange-

wandt werden. Öffnet man sich diesem Fachgebiet, erschließen

sich äußerst interessante Anwendungsmöglichkeiten.

Wie sieht die Zukunft der Biostatistik aus? Die Biostatistik wird

für die klinische und die forschende Medizin immer wichtiger

werden. Statistische Softwarepakete ermöglichen es, auch kompli-

zierte Auswertungen schnell und kompetent durchzuführen. Unser

Wissen und unser Handeln werden sich immer mehr auf das kol-

lektive Gesamtwissen stützen. Die Medizin des 21. Jahrhunderts

wird die 'evidence based medicine' sein.

Ziel dieses Buches ist es deshalb, Studenten einen kompetenten

Überblick über statistische Anwendungen

in der Medizin zu geben.

VI Vorwort

Das Buch ist breit angelegt. Es ist nicht nur Studenten bei den

Kurs- und Examensvorbereitungen nützlich, sondern auch als

Nachschlagekompendium geeignet. Die Methoden werden ver-

ständlich dargestellt und anhand von einfachen Beispielen ver-

deutlicht. Die mathematischen Formeln werden nicht nur aufgeli-

stet, sondern (soweit dies mit schulmathematischen Kenntnissen

möglich ist) auch hergeleitet. Diese Abhandlungen sind jedoch

nicht in den laufenden Text eingebettet. Der Leser kann bei Inter-

esse die Formeln nachvollziehen – für das grundsätzliche Ver-

ständnis des Stoffes ist dies nicht erforderlich. Es ist geplant, in

Kürze den Stoff durch Aufgaben im Internet abzurunden. Diese

Aufgaben haben unterschiedliche Schwierigkeitsgrade und werden

zusammen mit kommentierten Lösungen präsentiert.

Dieses Buch hätte nicht entstehen können ohne die Hilfe von zahl-

reichen Beteiligten. Hier sind in erster Linie Dr. Heiner Krieter,

Uwe Thomke und Sandra Glass vom wissenschaftlichen Beirat zu

nennen. Dr. Krieter stand immer als Ratgeber bezüglich medizini-

scher Fachfragen zur Verfügung und hat mich konstruktiv mit vie-

len eigenen Ideen unterstützt. Er hat – ebenso wie die beiden Stu-

denten Herr Thomke und Frau Glass – den ganzen Text durchge-

arbeitet und kritisch kommentiert. Herr PD Dr. Berthold Rzany,

Sc. M. hat als Epidemiologe freundlicherweise den letzten Teil

(Versuchsplanung) übernommen und mir darüber hinaus mit vie-

len wertvollen Hinweisen geholfen. Danken möchte ich auch Frau

Anne Repnow, Frau Dr. Petra Segräfe und Frau Constanze Sonn-

tag vom Springer-Verlag für ihre große Geduld und die hervorra-

gende Zusammenarbeit. Schließlich danke ich meinem Ehemann

und meinen kleinen Töchtern Judith und Miriam, die das alles er-

tragen haben.

Noch ein letztes: wie verhält es sich eigentlich mit den Klapper-

störchen und den kleinen Kindern? Gibt es hier tatsächlich einen

Zusammenhang – und wenn ja, wodurch ist dieser begründet? Le-

sen Sie dieses Buch – dann wissen Sie Bescheid!

Christel Weiß Mannheim, im Frühjahr 1999

1.1 Die Bedeutung der Statistik für die Medizin 1

1 Einleitung

1.1 Die Bedeutung der Statistik für die Medizin

Jeder medizinische Wissenschaftler und jeder praktisch tätige Arzt

weiß aus Erfahrung, daß alle Erkenntnisse und Entscheidungen in

der Medizin mit einer gewissen Unsicherheit behaftet sind. In die-

sem Punkt unterscheiden sich die Biowissenschaften grundlegend

von den exakten Naturwissenschaften: während die meisten Zu-

sammenhänge in der Mathematik oder der theoretischen Physik

determiniert und damit berechenbar sind (etwa aufgrund einer ma-

thematischen Gleichung oder eines physikalischen Gesetzes), un-

terliegen die Zustände und Vorgänge bei biologischen Systemen

auch dem Zufall. Aus diesem Grund lassen sich die Eigenschaften

eines Individuums oder medizinisch-biologische Abläufe allenfalls

abschätzen, aber niemals exakt berechnen oder vorhersagen.

Im allgemeinen sind zwar zahlreiche Faktoren bekannt, die

ein bestimmtes Merkmal beeinflussen. So ist etwa das Körperge-

wicht einer Person abhängig von deren Alter und Geschlecht;

außerdem sind genetische Einflüsse, die Körpergröße, pathologi-

sche und psychische Besonderheiten sowie eine Reihe weiterer

Einflußgrößen maßgebend. Es wird aber niemals möglich sein,

alle das Körpergewicht bestimmenden Faktoren zu benennen und

deren Einfluß im einzelnen zu quantifizieren. Dazu sind die Vor-

gänge und Zusammenhänge im menschlichen Organismus viel zu

komplex und von unserem Verstand nicht mehr nachvollziehbar.

Man geht deshalb davon aus, daß das Körpergewicht – wie alle

anderen physiologischen Parameter – letztlich auch dem Zufall

unterliegt.

Ebenso kennt man bei fast allen Krankheiten diverse Fakto-

ren, die deren Entstehen möglicherweise verursachen oder deren

Auftreten begünstigen. So weiß man beispielsweise, daß bei Men-

schen, die unter permanenter Anspannung leben und gleichzeitig

unter erhöhtem Blutdruck und starkem Übergewicht leiden, die

1 Einleitung 2

Gefahr eines Herzinfarkts besonders hoch ist, und jeder verant-

wortungsbewußte Arzt wird einen Risikopatienten darauf hinwei-

sen. Dessen ungeachtet gibt es Personen, die mit allen Risikofakto-

ren behaftet sind und dabei steinalt werden, ohne jemals einen

Herzinfarkt zu erleiden; andererseits bietet eine vermeintlich ge-

sunde Lebensweise, die alle bekannten Risikofaktoren ausschließt,

keinen zuverlässigen Schutz vor dieser Krankheit. Schließlich ist

auch hier der Zufall mitentscheidend. Aus diesem Grund kann bei

keinem Menschen präzise vorhergesagt werden, ob eine bestimmte

Krankheit im Laufe seines Lebens eintreten wird.

In Einzelfällen kann der Zufall zu extremen Werten oder zu

unerwarteten Ergebnissen führen. Deshalb erlebt jeder Mediziner

hin und wieder Überraschungen – angenehmer oder unangeneh-

mer Art. Dies gilt für den Wissenschaftler, dessen Forschungser-

gebnisse stets eine gewisse Irrtumswahrscheinlichkeit beinhalten,

ebenso wie für den behandelnden Arzt, der den Verlauf einer

Krankheit nicht vorhersehen kann und niemals mit absoluter Si-

cherheit weiß, ob eine therapeutische Maßnahme den gewünschten

Erfolg erzielen wird.

Die Statistik als die Wissenschaft des Zufalls stellt Methoden

zur Verfügung, mit denen es möglich ist, trotz der Unberechenbar-

keit der Einzelvorgänge allgemein gültige Aussagen herzuleiten.

Diese bilden die Basis für jede wissenschaftliche Erkenntnis und

jedes daraus abgeleitete ärztliche Handeln. Wann immer ein Arzt

eine Entscheidung zu treffen hat, wird er sich an seiner eigenen

Erfahrung sowie an diesen allgemeinen Grundsätzen orientieren.

Dieses Vorgehen garantiert zwar nicht, daß die Entscheidung in

jedem Fall sinnvoll ist und zum erwarteten Ergebnis führt. Sie ist

aber nachvollziehbar, und das Risiko einer Fehlentscheidung ist

minimiert. Der Zufall wird bei dieser Vorgehensweise nicht elimi-

niert, aber doch wenigstens quantifiziert.

Insofern ist die Statistik für die Medizin unentbehrlich, sowohl

um Forschung zu betreiben als auch um deren Ergebnisse in der

Praxis anzuwenden.

Teil I

Deskriptive Statistik

16 2 Theoretische Grundlagen

2 Theoretische Grundlagen

2.1 Grundgesamtheit und Stichprobe

Die Hypothesen, die in den Bio- und Sozialwissenschaften aufge-

stellt werden und zu verifizieren sind, beziehen sich meist auf eine

sehr große Anzahl von Individuen. Es wäre aus organisatorischen

und zeitlichen Gründen viel zu aufwendig oder gar unmöglich, die

gesamte Population zu untersuchen, auf die die Hypothese zutref-

fen könnte. Dies ist im allgemeinen auch gar nicht notwendig. Die

moderne Statistik stellt nämlich Methoden zur Verfügung, die es

ermöglichen, basierend auf einer relativ kleinen Stichprobe allge-

mein gültige Aussagen bezüglich einer weitaus größeren Grundge-

samtheit herzuleiten.

Eine Total- oder Vollerhebung wird daher nur in Ausnahme-

fällen durchgeführt. Beispielsweise beruhen die Todesursachensta-

tistiken, die im jährlich erscheinenden Statistischen Jahrbuch der

Bundesrepublik Deutschland veröffentlicht werden, medizinische

Vollerhebung. Im allgemeinen beschränkt man sich jedoch – ins-

besondere in der medizinischen Forschung – auf die Untersuchung

einer kleinen Teilmenge, nämlich der Stichprobe, und überträgt

die daraus gewonnenen Erkenntnisse auf die Grundgesamtheit.

Dies ist allerdings nur unter der Voraussetzung sinnvoll, daß die

charakteristischen Eigenschaften der Stichprobe – abgesehen von

zufällig bedingten Abweichungen – mit denen der Grundgesamt-

heit übereinstimmen. Eine solche Stichprobe heißt repräsentativ.

Bei vielen Untersuchungen ist man vor das Problem gestellt,

aus einer konkret vorgegebenen Grundgesamtheit eine repräsenta-

tive Stichprobe zu wählen. Ein Beispiel hierfür stellt eine Umfrage

vor einer politischen Wahl dar. Die Grundgesamtheit besteht in

diesem Fall aus allen wahlberechtigten Bürgern. Um eine Pro-

gnose zu erstellen, beschränkt man sich auf eine Stichprobe von

einigen tausend Personen. Diese Stichprobe muß repräsentativ

2.2 Die Aufgaben der deskriptiven Statistik 17

sein, damit sie das endgültige Wahlergebnis hinreichend genau

widerspiegelt.

Bei Untersuchungen in der Medizin ist die Problemstellung

häufig umgekehrt: gegeben ist eine konkrete Stichprobe (beispiels-

weise die Patienten, die im Rahmen einer Studie untersucht wer-

den). Danach ist zu klären, wie die Grundgesamtheit beschaffen

ist und ob die Ergebnisse aus der Stichprobe auf diese übertragbar

sind. Eine Antwort auf diese Frage beruht mehr auf sachlogischen

als auf statistischen Überlegungen und ist eng mit dem jeweiligen

Forschungsvorhaben verknüpft. Oft läßt sich die entsprechende

Grundgesamtheit gar nicht angeben. Man sollte sich in jedem Fall

davor hüten, allzu weitreichende Schlußfolgerungen zu ziehen, die

sich im nachhinein als falsch herausstellen könnten.

Dieses Problem kann man zwar umgehen, indem man eine

Untersuchung nur für einen speziellen, eng begrenzten Personen-

kreis durchführt und diesen als Grundgesamtheit auffaßt. Aller-

dings gelten die dadurch gewonnenen Ergebnisse nur einge-

schränkt auf die Menge der untersuchten Personen und lassen sich

nicht verallgemeinern.

2.2 Die Aufgaben der deskriptiven Statistik

Aus dem obigen Abschnitt geht hervor, daß bei einer Stichproben-

untersuchung die statistische Analyse aus 2 Teilen besteht. Zu-

nächst werden die Daten der Stichprobe ausgewertet mit dem Ziel,

deren charakteristische Eigenschaften zu beschreiben. Dies ist das

Aufgabengebiet der deskriptiven Statistik. Dazu zählen im einzel-

nen:

•das Zusammenfassen und Ordnen der Daten in übersichtlichen

Tabellen,

•das Erstellen von Diagrammen und

•das Berechnen charakteristischer Kenngrößen oder Maßzah-

len (z.B. Mittelwert, Standardabweichung, Korrelationskoeffi-

zient).

18 2 Theoretische Grundlagen

Stichprobe

deskriptive Statistik induktive Statistik

Grundgesamtheit

Abb. 2.1.

Grundgesamtheit und

Stichprobe

In einem zweiten Schritt versucht man dann, mit Methoden der

induktiven Statistik zu allgemein gültigen Aussagen bezüglich der

Grundgesamtheit zu gelangen. So gesehen, ist die deskriptive Sta-

tistik bei praktischen Anwendungen die Vorstufe zur induktiven

Statistik. Beide Teilbereiche sind zur Datenanalyse notwendig und

ergänzen sich.

Wenn anstelle einer Stichprobe die komplette Grundgesamt-

heit untersucht wird, werden die Daten mit Methoden der deskrip-

tiven Statistik ausgewertet. Eine weitere Analyse mittels indukti-

ver Statistik ist dabei nicht erforderlich.

2.3 Merkmale

2.3.1 Grundbegriffe

Die Personen oder Objekte einer Stichprobe werden als Untersu-

chungseinheiten (oder Merkmalsträger) bezeichnet. In der medi-

zinischen Forschung handelt es sich dabei meist um Patienten, ge-

sunde Probanden oder Versuchstiere. Darüber hinaus sind die Be-

obachtungseinheiten festzulegen – das sind die kleinsten Einhei-

ten, an denen die einzelnen Beobachtungen registriert werden.

Bei vielen Studien sind die Beobachtungseinheiten mit den

Untersuchungseinheiten identisch. Oft ist es jedoch angebracht,

2.3 Merkmale 19

die Beobachtungseinheiten näher zu spezifizieren. Wenn etwa von

mehreren Patienten das rechte und das linke Auge untersucht

wird, dann versteht man unter den Untersuchungseinheiten die

Patienten und unter den Beobachtungseinheiten die einzelnen

Augen. Wenn Patienten im Rahmen einer Studie mehrmals unter-

sucht werden, dann ist eine Beobachtungseinheit identisch mit

einem Patienten bezogen auf eine einzelne Untersuchung.

Die Beobachtungseinheiten sind durch bestimmte Merkmale

charakterisiert – das sind Eigenschaften, die für die betreffende

Studie relevant sind und statistisch ausgewertet werden. Alle

Werte, die ein bestimmtes Merkmal annehmen kann, heißen

Merkmalsausprägungen. Andere Eigenschaften der Beobach-

tungseinheiten sind – für die jeweilige Studie – uninteressant.

Die Art der Merkmale ist entscheidend für den weiteren Ver-

lauf der Untersuchung, insbesondere für den erforderlichen Stich-

probenumfang und die statistischen Analysemethoden. Deshalb

sind zu Beginn der Planungsphase die zu erfassenden Merkmale

genau festzulegen und deren Eigenschaften zu spezifizieren.

Bei einer medizinischen Studie werden in der Regel mehrere

Merkmale erhoben. Diese werden zunächst einzeln, also unabhän-

gig voneinander ausgewertet. Dies ist das Aufgabengebiet der uni-

variaten Datenbeschreibung, die in Kapitel 3 behandelt wird. In

vielen Fällen ist es darüber hinaus interessant, den Zusammen-

hang zwischen 2 Merkmalen zu untersuchen. Dieses Thema be-

handelt die bivariate Statistik in Kapitel 4. Mit multivariaten

Analysemethoden wird der Zusammenhang zwischen mehreren

Merkmalen erforscht. Diese Methoden können in diesem Buch

nicht ausführlich behandelt werden. In Kapitel 9 werden einige

kurz vorgestellt.

2.3.2 Ziel- und Einflußgrößen

Die Merkmale lassen sich grob einteilen in Ziel- und Einflußgrö-

ßen. Der eigentliche Zweck einer Studie besteht darin, Erkennt-

nisse über die Zielgrößen zu gewinnen. Die Merkmale, die in ei-

nem funktionalen Zusammenhang zu den Zielgrößen stehen und

diese beeinflussen, heißen Einflußgrößen. Sie lassen sich unter-

teilen in:

20 2 Theoretische Grundlagen

Zielgröße(n)

Faktor(en) Störgrößen

Begleit-

merkmal(e)

Abb. 2.2

Einflußgrößen und

Zielgrößen

•Faktoren, die erfaßt und ausgewertet werden,

•Begleitmerkmale, die eventuell erfaßt, aber im Rahmen der

aktuellen Studie nicht ausgewertet werden,

•Störgrößen, die im Versuchsplan nicht berücksichtigt sind

und deshalb nicht erfaßt werden.

Beispiel 2.1

Aus der Hypothese „Zigarettenrauchen beeinflußt das Entstehen eines Lun-

genkarzinoms“ geht hervor, daß das Merkmal „Entstehen eines Lungen-

karzinoms“ die Zielgröße ist, während „Zigarettenrauchen“ der zu untersu-

chende Faktor ist. Andere Einflußgrößen wie etwa das Alter der Untersu-

chungs

einheiten wird man im allgemei

nen auch er

fassen und – falls diese

Größen nicht explizit ausgewertet werden – als Begleitmerkmale behan-

deln. Zu den Störgrößen zählen genetische Veranlagungen, Umweltbela-

stungen etc. – also Merkmale, die ebenfalls das Entstehen eines Lungen-

karzinoms beeinflussen, aber nicht explizit erfaßt werden.

Anmerkung. Es gibt unverzerrende und verzerrende Störgrößen. Die unverzer-

renden sind verantwortlich für die zufallsbedingte Streuung der Versuchsergeb-

nisse. Die verzerrenden sind gefährlicher: sie können ein Ergebnis verfälschen

oder zu Fehlinterpretationen verleiten. Sie sind jedoch bei einer sorgfältigen

Versuchsplanung und –durchführung vermeidbar (s. Kap. 10).

2.3 Merkmale 21

2.3.3 Klassifikation nach Skalenniveaus

Jedes Merkmal läßt sich einem bestimmten Skalenniveau zuord-

nen. Dieses Niveau gibt Auskunft darüber, wie die entsprechenden

Daten weiterverarbeitet werden können.

Nominalskala. Sie hat das niedrigste Niveau; die Ausprägungen

unterscheiden sich nur begrifflich voneinander. Beispiele stellen

die Augenfarbe, die Haarfarbe oder die Blutgruppe dar. Eine Spe-

zialform bilden die Alternativmerkmale (die auch als dichotome

oder binäre Merkmale bezeichnet werden) mit nur 2 Ausprägun-

gen. So ist etwa das Geschlecht mit den Ausprägungen „männ-

lich“ und „weiblich“ ein Alternativmerkmal, ebenso der Rhesus-

faktor mit den Ausprägungen „positiv“ und „negativ“.

Ordinalskala (oder Rangskala). Sie besitzt ein höheres Niveau;

die Ausprägungen dieser Merkmale lassen sich in einer Rangfolge

anordnen. Ein bekanntes Beispiel bilden die Zensuren mit den

Ausprägungen 1 bis 6. Auch medizinische Scores sind ordinalska-

liert, ebenso das Merkmal Therapieerfolg mit den möglichen Ab-

stufungen „vollständig geheilt“ bis hin zu „Patient verstorben“.

Nominal- und ordinalskalierte Merkmale werden zusammen-

fassend als qualitative Merkmale bezeichnet. Es ist allgemein üb-

lich, diese Merkmale zahlenmäßig zu codieren. So kann das Ge-

schlecht einer Person durch die Zahlen 1 (für männlich) oder 2

(für weiblich) angegeben werden; der Therapieerfolg läßt sich mit

natürlichen Zahlen 0, 1, 2 ... beschreiben. Diese Zahlen haben je-

doch keine numerische Bedeutung. Man kann zwar 2 Ausprägun-

gen A und B eines nominalen Merkmals durch

oder

≠

miteinander in Beziehung setzen; bei einem ordinalen Merkmal

läßt sich eine der Relationen

oder

angeben.

Mathematische Operationen wie beispielsweise die Bildung einer

Differenz oder eines Quotienten sind jedoch sinnlos. Es leuchtet

ein, daß bei qualitativen Merkmalen weder der Abstand zwischen

2 Ausprägungen noch deren Verhältnis definiert ist.

Metrische Skala. Sie hat einen höheren Informationsgehalt als

die Ordinalskala. Metrisch skalierte Merkmale werden auch als

quantitativ bezeichnet, da sich die Ausprägungen zahlenmäßig

22 2 Theoretische Grundlagen

unterscheiden. Diese Meßstrukturen findet man vor allem im phy-

sikalisch-naturwissenschaftlichen Umfeld und damit auch in der

Medizin. Man unterscheidet 2 metrische Skalen. Bei der Intervall-

skala (auch Abstandsskala genannt) ist der Nullpunkt willkürlich

festgelegt, so daß auch negative Zahlenwerte auftreten können.

Die Verhältnisskala (oder Ratioskala) hat dagegen einen absolu-

ten Nullpunkt. Bei beiden Skalen kann die Differenz zwischen 2

Ausprägungen

−

berechnet werden; bei verhältnisskalierten

Merkmalen ist es darüber hinaus möglich, das Verhältnis

bilden (falls

≠

Beispiel 2.2

Das Merkmal „Temperatur in Celsiusgraden“ hat einen willkürlich festge-

legten Nullpunkt (Gefrierpunkt des Wassers) und ist deshalb intervallska-

liert. Beim Vergleich der beiden Ausprägungen 20

C und 40

C läßt sich

zwar der Abstand berechnen; es wäre aber unsinnig, die Werte in ein Ver-

hältnis zu setzen und zu sagen, 40°C seien doppelt so warm wie 20°C.

Viele Merkmale aus der Medizin sind verhältnisskaliert: das Körperge-

wicht, die Körpergröße, der

Chole

steringehalt

oder die

Leu

zytenanzahl

pro µl Blut. Vergleiche der Art „10.000 Leukozyten pro µl Blut sind dop-

pelt so viel wie 5.000“ sind bei diesen Merkmalen durchaus sinnvoll.

Anmerkung. Die Bezeichnungen „nominal“, „ordinal“ und „metrisch“ beziehen

sich ursprünglich auf die Skalenniveaus und nicht auf die dazugehörenden

Merkmale oder Daten. Diese werden korrekterweise als qualitativ bzw. quanti-

tativ oder – um das Skalenniveau hervorzuheben – als nominalskaliert, ordinals-

kaliert bzw. metrisch skaliert gekennzeichnet. Es hat sich jedoch mittlerweile

eingebürgert, nicht nur die Skalen, sondern auch die Merkmale und Daten mit

den Attributen nominal, ordinal bzw. metrisch zu kennzeichnen.

2.3.4 Diskrete und stetige Merkmale

Ferner kann man zwischen diskreten und stetigen Merkmale un-

terscheiden. Ein Merkmal heißt diskret, wenn es nur abzählbar

viele Werte annehmen kann. Alle qualitativen Merkmale sind tri-

vialerweise diskret. Quantitative Merkmale sind dann diskret,

wenn die Merkmalsausprägungen durch einen Zählvorgang ermit-

telt werden. Beispiele sind die Anzahl der Leukozyten pro µl Blut

oder die Anzahl richtig gelöster Klausuraufgaben.

2.3 Merkmale 23

Ein stetiges Merkmal kann dagegen alle Zahlenwerte innerhalb

eines bestimmten Intervalls annehmen; die Ausprägungen werden

in der Regel durch einen Meßvorgang ermittelt. Als Beispiele

seien die Körpergröße oder das Körpergewicht genannt. Aller-

dings läßt die begrenzte Meßgenauigkeit bei der Bestimmung

eines stetigen Merkmals nur abzählbar viele Ausprägungen zu. So

wird die Körpergröße meist in der Einheit „cm“ mit ganzzahligen

Zahlenwerten angegeben, wobei im Einzelfall auf- oder abgerun-

det wird. Deshalb ist bei praktischen Untersuchungen letzten

Endes jedes Merkmal diskret.

Übersicht 1: Die Skalenniveaus

Merk-

malsart Skalenniveau Beispiele Hinweise Vergleich 2er

Ausprägungen

qua-

litativ nicht-

metrisch Nominal-

skala Blutgruppe,

Rhesusfaktor niedrigstes

Niveau •

oder

≠

Ordinal-

skala

(Rangskala)

Intelligenz-

quotient,

med. Score

Rangfolge

ist definiert •

oder

≠

•

oder

quan-

titativ metrisch Intervall-

skala

(Abstands-

skala)

Temperatur

in Celsius-

Graden

Skala mit

willkür-

lichem

Nullpunkt,

Abstand ist

definiert

•

oder

≠

•

oder

•

−

Ratioskala

(Verhältnis-

skala)

Leukozyten-

anzahl pro

µl Blut,

Körpergröße

höchstes

Niveau,

Skala mit

abs. Null-

punkt,

Verhältnis

ist definiert

•

oder

≠

•

oder

•

−

•

(für

≠

)

24 2 Theoretische Grundlagen

Es gibt jedoch statistische Analysemethoden, die stetige Merkmale

voraussetzen und die dann angewandt werden, wenn das quantita-

tive Merkmal innerhalb eines bestimmten Bereichs zahlreiche,

fein abgestufte Ausprägungen hat. Insofern ist eine Unterschei-

dung zwischen diskreten und stetigen Merkmalen nicht nur theo-

retisch, sondern auch für praktische Anwendungen sinnvoll.

2.3.5 Skalentransformationen

Es ist generell möglich, ein höheres Skalenniveau auf ein niedri-

geres zu transformieren. Jede Verhältnisskala ist gleichzeitig eine

Intervallskala; diese wiederum kann als eine Ordinalskala aufge-

faßt werden. Die Nominalskala kann grundsätzlich jedem Merk-

mal zugeordnet werden. Es handelt sich bei einer Skalentransfor-

mation also immer um eine Reduktion des Niveaus.

Beispiel 2.3

Dieser Sachverhalt sei erläutert am Merkmal „Zigarettenkonsum eines

Patienten“. Die Merk

malsart und das Skalenniveau sind abhängig von der

Art, wie man dieses Merkmal mißt:

Ausprägungen

Merkmalsart

Skala

Menge des pro Jahr konsumierten

Tabaks in Gramm quantitativ-

stetig Verhältnis-

skala

Anzahl der pro Jahr gerauchten

Zigaretten quantitativ-

diskret Verhältnis-

skala

Nichtraucher – schwacher Raucher –

mäßiger Raucher – starker Raucher qualitativ Ordinalskala

Nichtraucher – Raucher qualitativ Nominalskala

Dieses Beispiel macht deutlich, daß eine Reduktion des Skalenni-

veaus einerseits mit einer einfacheren Meßtechnik einhergeht, an-

dererseits einen Informationsverlust beinhaltet. Dennoch ist eine

Skalentransformation bei praktischen Anwendungen zuweilen

sinnvoll. Um beispielsweise bei Routineuntersuchungen den Glu-

kosegehalt im Blut zu bestimmen, ist es nicht notwendig, diesen

exakt in mg zu erfassen. Statt dessen verwendet man Teststreifen

mit den Ergebnissen „negativ“ und „positiv“. Im Einzelfall ist stets

2.3 Merkmale 25

abzuwägen, ob das Skalenniveau zugunsten eines einfachen und

schnellen Meßverfahrens reduziert werden kann.

In den nachfolgenden Kapiteln wird gezeigt, daß die statisti-

schen Analysemethoden für metrisch skalierte Merkmale erheblich

differenziertere Auswertungen ermöglichen als die Methoden für

ordinal- oder nominalskalierte Merkmale. Eine Skalentransforma-

tion sollte man deshalb nur dann durchführen, wenn praktische

Gründe dies erfordern, und ansonsten versuchen, ein möglichst

hohes Niveau beizubehalten. Wenn jedoch Zweifel bestehen, ob

ein höheres Skalenniveau überhaupt angenommen werden kann,

sollte man sicherheitshalber das nächst niedrigere zugrunde legen.