Vorwort V
Vorwort
Es gibt keine gute Medizin ohne Biostatistik. Dieser Satz wird
bei den meisten Medizinstudenten auf Unverständnis stoßen.
Warum ist es wichtig, als Mediziner sich mit Biostatistik zu befas-
sen? Das ärztliche Handeln muß auf Wissen basieren. Alles andere
ist Scharlatanerie – auch wenn es mit gutem Gewissen und in be-
ster vorgebracht wird. Neues Wissen in der Medizin kann nur un-
ter Kenntnis und Anwendung von statistischen Methoden gewon-
nen werden. Sonst verfallen wir Zufällen und Halbwahrheiten, die
auch dann nicht besser werden, wenn sie mantrahaft wiederholt
werden.
Ist Biostatistik unattraktiv? Keineswegs – es gibt sogar Medizi-
ner, die Biostatistik faszinierend finden. Erst damit ist es möglich,
Forschungsergebnisse (auch eigene) zu verifizieren und zu bewer-
ten. Der schlechte Ruf, der diesem Fach vorauseilt, ist dadurch be-
gründet, daß statistische Methoden auf mathematischen Formeln
basieren, die für viele mathematikgeschädigte Mediziner ein
Greuel sind. Als Anwender muß man diese Formeln jedoch nicht
herleiten können oder auswendig lernen. Man sollte vielmehr ver-
stehen, wie statistische Methoden sinnvoll in der Medizin ange-
wandt werden. Öffnet man sich diesem Fachgebiet, erschließen
sich äußerst interessante Anwendungsmöglichkeiten.
Wie sieht die Zukunft der Biostatistik aus? Die Biostatistik wird
für die klinische und die forschende Medizin immer wichtiger
werden. Statistische Softwarepakete ermöglichen es, auch kompli-
zierte Auswertungen schnell und kompetent durchzuführen. Unser
Wissen und unser Handeln werden sich immer mehr auf das kol-
lektive Gesamtwissen stützen. Die Medizin des 21. Jahrhunderts
wird die 'evidence based medicine' sein.
Ziel dieses Buches ist es deshalb, Studenten einen kompetenten
Überblick über statistische Anwendungen
in der Medizin zu geben.
VI Vorwort
Das Buch ist breit angelegt. Es ist nicht nur Studenten bei den
Kurs- und Examensvorbereitungen nützlich, sondern auch als
Nachschlagekompendium geeignet. Die Methoden werden ver-
ständlich dargestellt und anhand von einfachen Beispielen ver-
deutlicht. Die mathematischen Formeln werden nicht nur aufgeli-
stet, sondern (soweit dies mit schulmathematischen Kenntnissen
möglich ist) auch hergeleitet. Diese Abhandlungen sind jedoch
nicht in den laufenden Text eingebettet. Der Leser kann bei Inter-
esse die Formeln nachvollziehen – für das grundsätzliche Ver-
ständnis des Stoffes ist dies nicht erforderlich. Es ist geplant, in
Kürze den Stoff durch Aufgaben im Internet abzurunden. Diese
Aufgaben haben unterschiedliche Schwierigkeitsgrade und werden
zusammen mit kommentierten Lösungen präsentiert.
Dieses Buch hätte nicht entstehen können ohne die Hilfe von zahl-
reichen Beteiligten. Hier sind in erster Linie Dr. Heiner Krieter,
Uwe Thomke und Sandra Glass vom wissenschaftlichen Beirat zu
nennen. Dr. Krieter stand immer als Ratgeber bezüglich medizini-
scher Fachfragen zur Verfügung und hat mich konstruktiv mit vie-
len eigenen Ideen unterstützt. Er hat – ebenso wie die beiden Stu-
denten Herr Thomke und Frau Glass – den ganzen Text durchge-
arbeitet und kritisch kommentiert. Herr PD Dr. Berthold Rzany,
Sc. M. hat als Epidemiologe freundlicherweise den letzten Teil
(Versuchsplanung) übernommen und mir darüber hinaus mit vie-
len wertvollen Hinweisen geholfen. Danken möchte ich auch Frau
Anne Repnow, Frau Dr. Petra Segräfe und Frau Constanze Sonn-
tag vom Springer-Verlag für ihre große Geduld und die hervorra-
gende Zusammenarbeit. Schließlich danke ich meinem Ehemann
und meinen kleinen Töchtern Judith und Miriam, die das alles er-
tragen haben.
Noch ein letztes: wie verhält es sich eigentlich mit den Klapper-
störchen und den kleinen Kindern? Gibt es hier tatsächlich einen
Zusammenhang – und wenn ja, wodurch ist dieser begründet? Le-
sen Sie dieses Buch – dann wissen Sie Bescheid!
Christel Weiß Mannheim, im Frühjahr 1999
1.1 Die Bedeutung der Statistik für die Medizin 1
1 Einleitung
1.1 Die Bedeutung der Statistik für die Medizin
Jeder medizinische Wissenschaftler und jeder praktisch tätige Arzt
weiß aus Erfahrung, daß alle Erkenntnisse und Entscheidungen in
der Medizin mit einer gewissen Unsicherheit behaftet sind. In die-
sem Punkt unterscheiden sich die Biowissenschaften grundlegend
von den exakten Naturwissenschaften: während die meisten Zu-
sammenhänge in der Mathematik oder der theoretischen Physik
determiniert und damit berechenbar sind (etwa aufgrund einer ma-
thematischen Gleichung oder eines physikalischen Gesetzes), un-
terliegen die Zustände und Vorgänge bei biologischen Systemen
auch dem Zufall. Aus diesem Grund lassen sich die Eigenschaften
eines Individuums oder medizinisch-biologische Abläufe allenfalls
abschätzen, aber niemals exakt berechnen oder vorhersagen.
Im allgemeinen sind zwar zahlreiche Faktoren bekannt, die
ein bestimmtes Merkmal beeinflussen. So ist etwa das Körperge-
wicht einer Person abhängig von deren Alter und Geschlecht;
außerdem sind genetische Einflüsse, die Körpergröße, pathologi-
sche und psychische Besonderheiten sowie eine Reihe weiterer
Einflußgrößen maßgebend. Es wird aber niemals möglich sein,
alle das Körpergewicht bestimmenden Faktoren zu benennen und
deren Einfluß im einzelnen zu quantifizieren. Dazu sind die Vor-
gänge und Zusammenhänge im menschlichen Organismus viel zu
komplex und von unserem Verstand nicht mehr nachvollziehbar.
Man geht deshalb davon aus, daß das Körpergewicht – wie alle
anderen physiologischen Parameter – letztlich auch dem Zufall
unterliegt.
Ebenso kennt man bei fast allen Krankheiten diverse Fakto-
ren, die deren Entstehen möglicherweise verursachen oder deren
Auftreten begünstigen. So weiß man beispielsweise, daß bei Men-
schen, die unter permanenter Anspannung leben und gleichzeitig
unter erhöhtem Blutdruck und starkem Übergewicht leiden, die
1 Einleitung 2
Gefahr eines Herzinfarkts besonders hoch ist, und jeder verant-
wortungsbewußte Arzt wird einen Risikopatienten darauf hinwei-
sen. Dessen ungeachtet gibt es Personen, die mit allen Risikofakto-
ren behaftet sind und dabei steinalt werden, ohne jemals einen
Herzinfarkt zu erleiden; andererseits bietet eine vermeintlich ge-
sunde Lebensweise, die alle bekannten Risikofaktoren ausschließt,
keinen zuverlässigen Schutz vor dieser Krankheit. Schließlich ist
auch hier der Zufall mitentscheidend. Aus diesem Grund kann bei
keinem Menschen präzise vorhergesagt werden, ob eine bestimmte
Krankheit im Laufe seines Lebens eintreten wird.
In Einzelfällen kann der Zufall zu extremen Werten oder zu
unerwarteten Ergebnissen führen. Deshalb erlebt jeder Mediziner
hin und wieder Überraschungen – angenehmer oder unangeneh-
mer Art. Dies gilt für den Wissenschaftler, dessen Forschungser-
gebnisse stets eine gewisse Irrtumswahrscheinlichkeit beinhalten,
ebenso wie für den behandelnden Arzt, der den Verlauf einer
Krankheit nicht vorhersehen kann und niemals mit absoluter Si-
cherheit weiß, ob eine therapeutische Maßnahme den gewünschten
Erfolg erzielen wird.
Die Statistik als die Wissenschaft des Zufalls stellt Methoden
zur Verfügung, mit denen es möglich ist, trotz der Unberechenbar-
keit der Einzelvorgänge allgemein gültige Aussagen herzuleiten.
Diese bilden die Basis für jede wissenschaftliche Erkenntnis und
jedes daraus abgeleitete ärztliche Handeln. Wann immer ein Arzt
eine Entscheidung zu treffen hat, wird er sich an seiner eigenen
Erfahrung sowie an diesen allgemeinen Grundsätzen orientieren.
Dieses Vorgehen garantiert zwar nicht, daß die Entscheidung in
jedem Fall sinnvoll ist und zum erwarteten Ergebnis führt. Sie ist
aber nachvollziehbar, und das Risiko einer Fehlentscheidung ist
minimiert. Der Zufall wird bei dieser Vorgehensweise nicht elimi-
niert, aber doch wenigstens quantifiziert.
Insofern ist die Statistik für die Medizin unentbehrlich, sowohl
um Forschung zu betreiben als auch um deren Ergebnisse in der
Praxis anzuwenden.
Teil I
Deskriptive Statistik
16 2 Theoretische Grundlagen
2 Theoretische Grundlagen
2.1 Grundgesamtheit und Stichprobe
Die Hypothesen, die in den Bio- und Sozialwissenschaften aufge-
stellt werden und zu verifizieren sind, beziehen sich meist auf eine
sehr große Anzahl von Individuen. Es wäre aus organisatorischen
und zeitlichen Gründen viel zu aufwendig oder gar unmöglich, die
gesamte Population zu untersuchen, auf die die Hypothese zutref-
fen könnte. Dies ist im allgemeinen auch gar nicht notwendig. Die
moderne Statistik stellt nämlich Methoden zur Verfügung, die es
ermöglichen, basierend auf einer relativ kleinen Stichprobe allge-
mein gültige Aussagen bezüglich einer weitaus größeren Grundge-
samtheit herzuleiten.
Eine Total- oder Vollerhebung wird daher nur in Ausnahme-
fällen durchgeführt. Beispielsweise beruhen die Todesursachensta-
tistiken, die im jährlich erscheinenden Statistischen Jahrbuch der
Bundesrepublik Deutschland veröffentlicht werden, medizinische
Register oder die Ergebnisse einer politischen Wahl auf einer
Vollerhebung. Im allgemeinen beschränkt man sich jedoch – ins-
besondere in der medizinischen Forschung – auf die Untersuchung
einer kleinen Teilmenge, nämlich der Stichprobe, und überträgt
die daraus gewonnenen Erkenntnisse auf die Grundgesamtheit.
Dies ist allerdings nur unter der Voraussetzung sinnvoll, daß die
charakteristischen Eigenschaften der Stichprobe – abgesehen von
zufällig bedingten Abweichungen – mit denen der Grundgesamt-
heit übereinstimmen. Eine solche Stichprobe heißt repräsentativ.
Bei vielen Untersuchungen ist man vor das Problem gestellt,
aus einer konkret vorgegebenen Grundgesamtheit eine repräsenta-
tive Stichprobe zu wählen. Ein Beispiel hierfür stellt eine Umfrage
vor einer politischen Wahl dar. Die Grundgesamtheit besteht in
diesem Fall aus allen wahlberechtigten Bürgern. Um eine Pro-
gnose zu erstellen, beschränkt man sich auf eine Stichprobe von
einigen tausend Personen. Diese Stichprobe muß repräsentativ
2.2 Die Aufgaben der deskriptiven Statistik 17
sein, damit sie das endgültige Wahlergebnis hinreichend genau
widerspiegelt.
Bei Untersuchungen in der Medizin ist die Problemstellung
häufig umgekehrt: gegeben ist eine konkrete Stichprobe (beispiels-
weise die Patienten, die im Rahmen einer Studie untersucht wer-
den). Danach ist zu klären, wie die Grundgesamtheit beschaffen
ist und ob die Ergebnisse aus der Stichprobe auf diese übertragbar
sind. Eine Antwort auf diese Frage beruht mehr auf sachlogischen
als auf statistischen Überlegungen und ist eng mit dem jeweiligen
Forschungsvorhaben verknüpft. Oft läßt sich die entsprechende
Grundgesamtheit gar nicht angeben. Man sollte sich in jedem Fall
davor hüten, allzu weitreichende Schlußfolgerungen zu ziehen, die
sich im nachhinein als falsch herausstellen könnten.
Dieses Problem kann man zwar umgehen, indem man eine
Untersuchung nur für einen speziellen, eng begrenzten Personen-
kreis durchführt und diesen als Grundgesamtheit auffaßt. Aller-
dings gelten die dadurch gewonnenen Ergebnisse nur einge-
schränkt auf die Menge der untersuchten Personen und lassen sich
nicht verallgemeinern.
2.2 Die Aufgaben der deskriptiven Statistik
Aus dem obigen Abschnitt geht hervor, daß bei einer Stichproben-
untersuchung die statistische Analyse aus 2 Teilen besteht. Zu-
nächst werden die Daten der Stichprobe ausgewertet mit dem Ziel,
deren charakteristische Eigenschaften zu beschreiben. Dies ist das
Aufgabengebiet der deskriptiven Statistik. Dazu zählen im einzel-
nen:
•das Zusammenfassen und Ordnen der Daten in übersichtlichen
Tabellen,
•das Erstellen von Diagrammen und
•das Berechnen charakteristischer Kenngrößen oder Maßzah-
len (z.B. Mittelwert, Standardabweichung, Korrelationskoeffi-
zient).
18 2 Theoretische Grundlagen
Stichprobe
deskriptive Statistik induktive Statistik
Grundgesamtheit
Abb. 2.1.
Grundgesamtheit und
Stichprobe
In einem zweiten Schritt versucht man dann, mit Methoden der
induktiven Statistik zu allgemein gültigen Aussagen bezüglich der
Grundgesamtheit zu gelangen. So gesehen, ist die deskriptive Sta-
tistik bei praktischen Anwendungen die Vorstufe zur induktiven
Statistik. Beide Teilbereiche sind zur Datenanalyse notwendig und
ergänzen sich.
Wenn anstelle einer Stichprobe die komplette Grundgesamt-
heit untersucht wird, werden die Daten mit Methoden der deskrip-
tiven Statistik ausgewertet. Eine weitere Analyse mittels indukti-
ver Statistik ist dabei nicht erforderlich.
2.3 Merkmale
2.3.1 Grundbegriffe
Die Personen oder Objekte einer Stichprobe werden als Untersu-
chungseinheiten (oder Merkmalsträger) bezeichnet. In der medi-
zinischen Forschung handelt es sich dabei meist um Patienten, ge-
sunde Probanden oder Versuchstiere. Darüber hinaus sind die Be-
obachtungseinheiten festzulegen – das sind die kleinsten Einhei-
ten, an denen die einzelnen Beobachtungen registriert werden.
Bei vielen Studien sind die Beobachtungseinheiten mit den
Untersuchungseinheiten identisch. Oft ist es jedoch angebracht,
2.3 Merkmale 19
die Beobachtungseinheiten näher zu spezifizieren. Wenn etwa von
mehreren Patienten das rechte und das linke Auge untersucht
wird, dann versteht man unter den Untersuchungseinheiten die
Patienten und unter den Beobachtungseinheiten die einzelnen
Augen. Wenn Patienten im Rahmen einer Studie mehrmals unter-
sucht werden, dann ist eine Beobachtungseinheit identisch mit
einem Patienten bezogen auf eine einzelne Untersuchung.
Die Beobachtungseinheiten sind durch bestimmte Merkmale
charakterisiert – das sind Eigenschaften, die für die betreffende
Studie relevant sind und statistisch ausgewertet werden. Alle
Werte, die ein bestimmtes Merkmal annehmen kann, heißen
Merkmalsausprägungen. Andere Eigenschaften der Beobach-
tungseinheiten sind – für die jeweilige Studie – uninteressant.
Die Art der Merkmale ist entscheidend für den weiteren Ver-
lauf der Untersuchung, insbesondere für den erforderlichen Stich-
probenumfang und die statistischen Analysemethoden. Deshalb
sind zu Beginn der Planungsphase die zu erfassenden Merkmale
genau festzulegen und deren Eigenschaften zu spezifizieren.
Bei einer medizinischen Studie werden in der Regel mehrere
Merkmale erhoben. Diese werden zunächst einzeln, also unabhän-
gig voneinander ausgewertet. Dies ist das Aufgabengebiet der uni-
variaten Datenbeschreibung, die in Kapitel 3 behandelt wird. In
vielen Fällen ist es darüber hinaus interessant, den Zusammen-
hang zwischen 2 Merkmalen zu untersuchen. Dieses Thema be-
handelt die bivariate Statistik in Kapitel 4. Mit multivariaten
Analysemethoden wird der Zusammenhang zwischen mehreren
Merkmalen erforscht. Diese Methoden können in diesem Buch
nicht ausführlich behandelt werden. In Kapitel 9 werden einige
kurz vorgestellt.
2.3.2 Ziel- und Einflußgrößen
Die Merkmale lassen sich grob einteilen in Ziel- und Einflußgrö-
ßen. Der eigentliche Zweck einer Studie besteht darin, Erkennt-
nisse über die Zielgrößen zu gewinnen. Die Merkmale, die in ei-
nem funktionalen Zusammenhang zu den Zielgrößen stehen und
diese beeinflussen, heißen Einflußgrößen. Sie lassen sich unter-
teilen in:
20 2 Theoretische Grundlagen
Zielgröße(n)
Faktor(en) Störgrößen
Begleit-
merkmal(e)
Abb. 2.2
Einflußgrößen und
Zielgrößen
•Faktoren, die erfaßt und ausgewertet werden,
•Begleitmerkmale, die eventuell erfaßt, aber im Rahmen der
aktuellen Studie nicht ausgewertet werden,
•Störgrößen, die im Versuchsplan nicht berücksichtigt sind
und deshalb nicht erfaßt werden.
Beispiel 2.1
Aus der Hypothese „Zigarettenrauchen beeinflußt das Entstehen eines Lun-
genkarzinoms“ geht hervor, daß das Merkmal „Entstehen eines Lungen-
karzinoms“ die Zielgröße ist, während „Zigarettenrauchen“ der zu untersu-
chende Faktor ist. Andere Einflußgrößen wie etwa das Alter der Untersu-
chungs
einheiten wird man im allgemei
nen auch er
fassen und – falls diese
Größen nicht explizit ausgewertet werden – als Begleitmerkmale behan-
deln. Zu den Störgrößen zählen genetische Veranlagungen, Umweltbela-
stungen etc. – also Merkmale, die ebenfalls das Entstehen eines Lungen-
karzinoms beeinflussen, aber nicht explizit erfaßt werden.
Anmerkung. Es gibt unverzerrende und verzerrende Störgrößen. Die unverzer-
renden sind verantwortlich für die zufallsbedingte Streuung der Versuchsergeb-
nisse. Die verzerrenden sind gefährlicher: sie können ein Ergebnis verfälschen
oder zu Fehlinterpretationen verleiten. Sie sind jedoch bei einer sorgfältigen
Versuchsplanung und –durchführung vermeidbar (s. Kap. 10).
2.3 Merkmale 21
2.3.3 Klassifikation nach Skalenniveaus
Jedes Merkmal läßt sich einem bestimmten Skalenniveau zuord-
nen. Dieses Niveau gibt Auskunft darüber, wie die entsprechenden
Daten weiterverarbeitet werden können.
Nominalskala. Sie hat das niedrigste Niveau; die Ausprägungen
unterscheiden sich nur begrifflich voneinander. Beispiele stellen
die Augenfarbe, die Haarfarbe oder die Blutgruppe dar. Eine Spe-
zialform bilden die Alternativmerkmale (die auch als dichotome
oder binäre Merkmale bezeichnet werden) mit nur 2 Ausprägun-
gen. So ist etwa das Geschlecht mit den Ausprägungen „männ-
lich“ und „weiblich“ ein Alternativmerkmal, ebenso der Rhesus-
faktor mit den Ausprägungen „positiv“ und „negativ“.
Ordinalskala (oder Rangskala). Sie besitzt ein höheres Niveau;
die Ausprägungen dieser Merkmale lassen sich in einer Rangfolge
anordnen. Ein bekanntes Beispiel bilden die Zensuren mit den
Ausprägungen 1 bis 6. Auch medizinische Scores sind ordinalska-
liert, ebenso das Merkmal Therapieerfolg mit den möglichen Ab-
stufungen „vollständig geheilt“ bis hin zu „Patient verstorben“.
Nominal- und ordinalskalierte Merkmale werden zusammen-
fassend als qualitative Merkmale bezeichnet. Es ist allgemein üb-
lich, diese Merkmale zahlenmäßig zu codieren. So kann das Ge-
schlecht einer Person durch die Zahlen 1 (für männlich) oder 2
(für weiblich) angegeben werden; der Therapieerfolg läßt sich mit
natürlichen Zahlen 0, 1, 2 ... beschreiben. Diese Zahlen haben je-
doch keine numerische Bedeutung. Man kann zwar 2 Ausprägun-
gen A und B eines nominalen Merkmals durch
A
B
=
oder
A
B
≠
miteinander in Beziehung setzen; bei einem ordinalen Merkmal
läßt sich eine der Relationen
A
B
=
,
A
B
<
oder
A
B
>
angeben.
Mathematische Operationen wie beispielsweise die Bildung einer
Differenz oder eines Quotienten sind jedoch sinnlos. Es leuchtet
ein, daß bei qualitativen Merkmalen weder der Abstand zwischen
2 Ausprägungen noch deren Verhältnis definiert ist.
Metrische Skala. Sie hat einen höheren Informationsgehalt als
die Ordinalskala. Metrisch skalierte Merkmale werden auch als
quantitativ bezeichnet, da sich die Ausprägungen zahlenmäßig
22 2 Theoretische Grundlagen
unterscheiden. Diese Meßstrukturen findet man vor allem im phy-
sikalisch-naturwissenschaftlichen Umfeld und damit auch in der
Medizin. Man unterscheidet 2 metrische Skalen. Bei der Intervall-
skala (auch Abstandsskala genannt) ist der Nullpunkt willkürlich
festgelegt, so daß auch negative Zahlenwerte auftreten können.
Die Verhältnisskala (oder Ratioskala) hat dagegen einen absolu-
ten Nullpunkt. Bei beiden Skalen kann die Differenz zwischen 2
Ausprägungen
A
B
−
berechnet werden; bei verhältnisskalierten
Merkmalen ist es darüber hinaus möglich, das Verhältnis
A
B
:
zu
bilden (falls
B
≠
0
).
Beispiel 2.2
Das Merkmal „Temperatur in Celsiusgraden“ hat einen willkürlich festge-
legten Nullpunkt (Gefrierpunkt des Wassers) und ist deshalb intervallska-
liert. Beim Vergleich der beiden Ausprägungen 20
°
C und 40
°
C läßt sich
zwar der Abstand berechnen; es wäre aber unsinnig, die Werte in ein Ver-
hältnis zu setzen und zu sagen, 40°C seien doppelt so warm wie 20°C.
Viele Merkmale aus der Medizin sind verhältnisskaliert: das Körperge-
wicht, die Körpergröße, der
Chole
steringehalt
oder die
Leu
ko
zytenanzahl
pro µl Blut. Vergleiche der Art „10.000 Leukozyten pro µl Blut sind dop-
pelt so viel wie 5.000“ sind bei diesen Merkmalen durchaus sinnvoll.
Anmerkung. Die Bezeichnungen „nominal“, „ordinal“ und „metrisch“ beziehen
sich ursprünglich auf die Skalenniveaus und nicht auf die dazugehörenden
Merkmale oder Daten. Diese werden korrekterweise als qualitativ bzw. quanti-
tativ oder – um das Skalenniveau hervorzuheben – als nominalskaliert, ordinals-
kaliert bzw. metrisch skaliert gekennzeichnet. Es hat sich jedoch mittlerweile
eingebürgert, nicht nur die Skalen, sondern auch die Merkmale und Daten mit
den Attributen nominal, ordinal bzw. metrisch zu kennzeichnen.
2.3.4 Diskrete und stetige Merkmale
Ferner kann man zwischen diskreten und stetigen Merkmale un-
terscheiden. Ein Merkmal heißt diskret, wenn es nur abzählbar
viele Werte annehmen kann. Alle qualitativen Merkmale sind tri-
vialerweise diskret. Quantitative Merkmale sind dann diskret,
wenn die Merkmalsausprägungen durch einen Zählvorgang ermit-
telt werden. Beispiele sind die Anzahl der Leukozyten pro µl Blut
oder die Anzahl richtig gelöster Klausuraufgaben.
2.3 Merkmale 23
Ein stetiges Merkmal kann dagegen alle Zahlenwerte innerhalb
eines bestimmten Intervalls annehmen; die Ausprägungen werden
in der Regel durch einen Meßvorgang ermittelt. Als Beispiele
seien die Körpergröße oder das Körpergewicht genannt. Aller-
dings läßt die begrenzte Meßgenauigkeit bei der Bestimmung
eines stetigen Merkmals nur abzählbar viele Ausprägungen zu. So
wird die Körpergröße meist in der Einheit „cm“ mit ganzzahligen
Zahlenwerten angegeben, wobei im Einzelfall auf- oder abgerun-
det wird. Deshalb ist bei praktischen Untersuchungen letzten
Endes jedes Merkmal diskret.
Übersicht 1: Die Skalenniveaus
Merk-
malsart Skalenniveau Beispiele Hinweise Vergleich 2er
Ausprägungen
qua-
litativ nicht-
metrisch Nominal-
skala Blutgruppe,
Rhesusfaktor niedrigstes
Niveau •
A
B
=
oder
A
B
≠
Ordinal-
skala
(Rangskala)
Intelligenz-
quotient,
med. Score
Rangfolge
ist definiert •
A
B
=
oder
A
B
≠
•
A
B
=
,
A
B
>
oder
A
B
<
quan-
titativ metrisch Intervall-
skala
(Abstands-
skala)
Temperatur
in Celsius-
Graden
Skala mit
willkür-
lichem
Nullpunkt,
Abstand ist
definiert
•
A
B
=
oder
A
B
≠
•
A
B
=
,
A
B
>
oder
A
B
<
•
d
A
B
=
−
Ratioskala
(Verhältnis-
skala)
Leukozyten-
anzahl pro
µl Blut,
Körpergröße
höchstes
Niveau,
Skala mit
abs. Null-
punkt,
Verhältnis
ist definiert
•
A
B
=
oder
A
B
≠
•
A
B
=
,
A
B
>
oder
A
B
<
•
d
A
B
=
−
•
c
A
B
=
:
(für
B
≠
0
)
24 2 Theoretische Grundlagen
Es gibt jedoch statistische Analysemethoden, die stetige Merkmale
voraussetzen und die dann angewandt werden, wenn das quantita-
tive Merkmal innerhalb eines bestimmten Bereichs zahlreiche,
fein abgestufte Ausprägungen hat. Insofern ist eine Unterschei-
dung zwischen diskreten und stetigen Merkmalen nicht nur theo-
retisch, sondern auch für praktische Anwendungen sinnvoll.
2.3.5 Skalentransformationen
Es ist generell möglich, ein höheres Skalenniveau auf ein niedri-
geres zu transformieren. Jede Verhältnisskala ist gleichzeitig eine
Intervallskala; diese wiederum kann als eine Ordinalskala aufge-
faßt werden. Die Nominalskala kann grundsätzlich jedem Merk-
mal zugeordnet werden. Es handelt sich bei einer Skalentransfor-
mation also immer um eine Reduktion des Niveaus.
Beispiel 2.3
Dieser Sachverhalt sei erläutert am Merkmal „Zigarettenkonsum eines
Patienten“. Die Merk
malsart und das Skalenniveau sind abhängig von der
Art, wie man dieses Merkmal mißt:
Ausprägungen
Merkmalsart
Skala
Menge des pro Jahr konsumierten
Tabaks in Gramm quantitativ-
stetig Verhältnis-
skala
Anzahl der pro Jahr gerauchten
Zigaretten quantitativ-
diskret Verhältnis-
skala
Nichtraucher – schwacher Raucher –
mäßiger Raucher – starker Raucher qualitativ Ordinalskala
Nichtraucher – Raucher qualitativ Nominalskala
Dieses Beispiel macht deutlich, daß eine Reduktion des Skalenni-
veaus einerseits mit einer einfacheren Meßtechnik einhergeht, an-
dererseits einen Informationsverlust beinhaltet. Dennoch ist eine
Skalentransformation bei praktischen Anwendungen zuweilen
sinnvoll. Um beispielsweise bei Routineuntersuchungen den Glu-
kosegehalt im Blut zu bestimmen, ist es nicht notwendig, diesen
exakt in mg zu erfassen. Statt dessen verwendet man Teststreifen
mit den Ergebnissen „negativ“ und „positiv“. Im Einzelfall ist stets
2.3 Merkmale 25
abzuwägen, ob das Skalenniveau zugunsten eines einfachen und
schnellen Meßverfahrens reduziert werden kann.
In den nachfolgenden Kapiteln wird gezeigt, daß die statisti-
schen Analysemethoden für metrisch skalierte Merkmale erheblich
differenziertere Auswertungen ermöglichen als die Methoden für
ordinal- oder nominalskalierte Merkmale. Eine Skalentransforma-
tion sollte man deshalb nur dann durchführen, wenn praktische
Gründe dies erfordern, und ansonsten versuchen, ein möglichst
hohes Niveau beizubehalten. Wenn jedoch Zweifel bestehen, ob
ein höheres Skalenniveau überhaupt angenommen werden kann,
sollte man sicherheitshalber das nächst niedrigere zugrunde legen.