scieee Science in your language
[de] (orig) [fr] [it] [es]
Vorwort I
Vorwort
Im folgenden werden einige Aufgaben zum Lehrbuch Basiswissen – Medizinische
Statistik(erschienen im Springer-Verlag, April 1999) zusammen mit kommentierten
Lösungen präsentiert. Der Leser soll damit die Möglichkeit haben, sein Verständnis zu
überprüfen und sein Wissen zu vertiefen. Außerdem kann er (oder sie) erkennen, daß
die erworbenen Kenntnisse keineswegs nur theoretischer Natur sind, sondern sich vor
allem bei praktischen Fragestellungen anwenden lassen. Der Autorin bietet sich dabei
die Gelegenheit, ergänzend zum Buch auf wichtige Zusammenhänge, Besonderheiten,
beliebte Irrtümer etc. hinzuweisen.
Die Aufgaben sind wie bei einer Biomathe-Klausur gestaltet: es werden 5 Antworten
vorgegeben, von denen genau eine richtig ist. Für jedes Buchkapitel 2 bis 11 werden je-
weils 10 bis 15 Aufgaben aufgelistet, daran anschließend (farblich hervorgehoben) die
dazugehörenden Lösungen. Nun kann zwar nicht garantiert werden, daß ein Student,
nachdem er die Aufgaben gelöst und inhaltlich verstanden hat, die Klausur mit Bravour
besteht – er hat aber mit Sicherheit eine gute Ausgangsposition. Aufgaben, die über den
Stoff des Gegenstandskatalogs hinausgehen und daher für die Klausur wenig relevant
sind, sind mit einem Sternchen gekennzeichnet.
Die Aufgaben wurden mittlerweile von zahlreichen Studenten des Klinikums Mannheim
überarbeitet und kommentiert; deren Verbesserungsvorschläge wurden selbstver-
ständlich gerne übernommen. Außerdem findet sich am Ende des Aufgabenteils ein
Abschnitt Errata, in dem auf Fehler im Buch hingewiesen wird, die sich trotz mehr-
fachen Korrekturlesen eingeschlichen haben.
Übrigens: für Hinweise, Kritik und Verbesserungsvorschläge bin ich jederzeit dankbar.
Sie können mich erreichen über meine Dienstadresse (Klinikum Mannheim, ZMF,
68135 Mannheim) oder per E-Mail ([email protected]).
Mannheim, im August 1999
Christel Weiß
II 1 Inhaltsverzeichnis
1 Inhaltsverzeichnis der Aufgabenseiten
Teil I: Deskriptive Statistik..................................................................................1
2Theoretische Grundlagen..............................................................................1
2.1 Aufgaben.........................................................................................................1
2.2 Lösungen.........................................................................................................5
3Univariate Datenbeschreibung......................................................................8
3.1 Aufgaben.........................................................................................................8
3.2 Lösungen.......................................................................................................13
4Bivariate Datenbeschreibung......................................................................17
4.1 Aufgaben.......................................................................................................17
4.2 Lösungen.......................................................................................................21
Teil II: Wahrscheinlichkeitsrechnung ................................................................25
5Grundlagen der Wahrscheinlichkeitsrechnung..........................................25
5.1 Aufgaben.......................................................................................................25
5.2 Lösungen.......................................................................................................30
6Spezielle Wahrscheinlichkeiten in der Medizin..........................................34
6.1 Aufgaben.......................................................................................................34
6.2 Lösungen.......................................................................................................37
7Einige theoretische Verteilungen ................................................................40
7.1 Aufgaben.......................................................................................................40
7.2 Lösungen.......................................................................................................45
Teil III: Induktive Statistik...................................................................................49
8Schätzverfahren...........................................................................................49
8.1 Aufgaben.......................................................................................................49
8.2 Lösungen.......................................................................................................53
9Statistische Tests..........................................................................................56
9.1 Aufgaben.......................................................................................................56
9.2 Lösungen.......................................................................................................61
Teil IV: Versuchsplanung.....................................................................................65
10 Grundlagen der Versuchsplanung..............................................................65
10.1 Aufgaben.......................................................................................................65
10.2 Lösungen.......................................................................................................69
11 Studientypen................................................................................................72
11.1 Aufgaben.......................................................................................................72
11.2 Lösungen.......................................................................................................76
Errata im Buch .......................................................................................................81
2 Theoretische Grundlagen 1
Teil I: Deskriptive Statistik
2 Theoretische Grundlagen
Aufgabe 2.1: Beobachtungseinheiten
Bei 50 erstgebärenden Frauen wird die Wirksamkeit eines Medikaments untersucht, das
bei Wehenschwäche den Muttermund öffnen soll. Die Beobachtungseinheiten sind:
A. die Hebammen, die die Frauen während der Geburt beobachten
B. die gemessenen Werte für die Geschwindigkeit, mit der sich nach Verabreichung
des Medikaments der Muttermund öffnet
C. die Ärzte, die die Daten auswerten
D. die 50 Frauen, die das Medikament erhalten
E. alle Frauen, bei denen dieses Medikament theoretisch hilfreich sein kann
Aufgabe 2.2: Merkmalseigenschaften ASA-Gruppe
Jeder Patient, der sich im Klinikum M. einer Operation unterzieht, wird bzgl. des Risi-
kos eingestuft nach ASA I (geringes Risiko), ASA II bis ASA V (sehr schweres Risi-
ko). Welche Eigenschaften hat dieses Merkmal?
A. Alternativmerkmal
B. qualitativ, nur nominalskaliert
C. qualitativ, ordinalskaliert
D. quantitativ, diskret
E. quantitativ, stetig
Aufgabe 2.3: Einfluß- und Zielgrößen
In einer gynäkologischen Klinik wird untersucht, wie sich die Rauchgewohnheiten
schwangerer Frauen auf das Geburtsgewicht ihrer Kinder auswirken. Es werden erfaßt:
die durchschnittliche Anzahl der Zigaretten, die die Mutter pro Tag raucht,
das Geburtsgewicht des Kindes,
das Alter der Mutter,
das Körpergewicht der Mutter vor der Schwangerschaft
(der Einfluß der beiden letzten Merkmale wird aber nicht ausgewertet). Wie lassen sich
die Merkmale einordnen?
1 Anzahl der pro Tag gerauchten Zigaretten
2 Alter der Mutter a Faktor
3 Gewicht der Mutter vor der Schwangerschaft
4 psychische oder soziale Belastungen der Mutter b Begleitmerkmal
c Störgröße
5 Ernährungsweise der Mutter d Zielgröße
6 Geburtsgewicht des Kindes
22 Theoretische Grundlagen
A. 1a, 2b, 3b, 4c, 5c, 6d
B. 1a, 2a, 3a, 4c, 5c, 6d
C. 1c, 2a, 3a, 4c, 5b, 6d
D. 1a, 2b, 3b, 4a, 5a, 6d
E. 1a, 2a, 3a, 4c, 5c, 6a
Aufgabe 2.4: Merkmale des Blutes und deren Skalenniveaus
Bitte ordnen Sie den folgenden Merkmalen, die das Blut betreffen, die dazugehörenden
Skalen (mit dem jeweils höchsten Niveau) zu.
1. spezifisches Gewicht a. Nominalskala
2. Senkungsgeschwindigkeit b. Ordinalskala
3. Anzahl der Thrombozyten pro µl c. Intervallskala
4. Blutgruppe d. Verhältnisskala
5. Temperatur in Celsius-Graden
A. 1d, 2d, 3d, 4a, 5d
B. 1d, 2d, 3d, 4a, 5c
C. 1d, 2c, 3b, 4a, 5a
D. 1d, 2d, 3c, 4b, 5c
E. 1c, 2c, 3b, 4c, 5a
Aufgabe 2.5: Diskrete und stetige Merkmale des Blutes
Welche der im folgenden aufgelisteten Merkmale sind diskret ?
1. pH-Wert
2. Rhesusfaktor
3. Blutgruppe
4. Hämatokrit
5. Anzahl der Leukozyten pro µl Blut
6. Erkrankung an Leukämie (mit den Ausprägungen ja / nein)
A. kein Merkmal ist diskret
B. alle Merkmale sind diskret
C. nur 2 und 3 sind diskret
D. nur 2, 3, 5 und 6 sind diskret
E. alle außer 4 sind diskret
Aufgabe 2.6: Eigenschaften stetiger Merkmale
Beurteilen Sie die folgende Aussage:
1. Der Glukosegehalt im Blut ist ein stetiges Merkmal,
denn
2. dieses Merkmal ist nicht qualitativ.
2 Theoretische Grundlagen 3
Aussage 1 Aussage 2 Verknüpfung
A. richtig richtig richtig
B. richtig richtig falsch
C. richtig falsch –––
D. falsch richtig –––
E. falsch falsch
Aufgabe 2.7: Skalentransformationen allgemein
Welche Aussage trifft zu?
A. Eine Ordinalskala kann auf eine Intervallskala transformiert werden, wenn alle
Ausprägungen numerisch codiert sind.
B. Ein qualitatives Merkmal mit sehr zahlreichen Ausprägungen kann als ein stetiges
angesehen werden.
C. Die Transformation auf ein anderes Skalenniveau ist generell nicht möglich.
D. Die Transformation auf ein anderes Niveau ist immer möglich, aber niemals sinn-
voll.
E. Eine Verhältnisskala kann auf eine Ordinalskala transformiert werden.
Aufgabe 2.8: Skalentransformation beim Eiweißgehalt
Der Eiweißgehalt im Urin läßt sich exakt in mg/dl messen. Bei einer Routineuntersu-
chung werden Teststreifen verwendet, mit denen sich lediglich feststellen läßt, ob der
Eiweißgehalt im pathologischen Bereich liegt. Welche Aussage bzgl. dieses Meßver-
fahrens trifft nicht zu?
A. Theoretisch wird eine Reduktion von einer metrischen Skala auf eine Nominalskala
durchgeführt.
B. Der Eiweißgehalt wird bei dieser Meßmethode als ein Alternativmerkmal erfaßt.
C. Die Meßmethode ist in jedem Fall sinnlos, da sehr viel Information verloren geht.
D. Das Meßverfahren ist einfacher durchzuführen als die exakte Messung in mg/dl.
E. Die Ergebnisse dieses Meßverfahrens ermöglichen weniger differenzierte Aus-
wertungen als die exakten Meßwerte in mg/dl.
Aufgabe 2.9: Ausprägungsliste mit Laborwerten
In einer Klinik werden bei Patienten, die planmäßig operiert werden, präoperativ La-
borwerte erfaßt und in einem EDV-System wie folgt dokumentiert:
0: es liegen keine Laborwerte vor
1: alle Werte sind normal
2: Blutwerte pathologisch
3: Gerinnungswerte pathologisch
4: Säure-Basen-Haushalt pathologisch
5: andere Werte pathologisch
42 Theoretische Grundlagen
Falls mehrere Ausprägungen zutreffen, wird die Summe notiert. Diese Ausprägungsliste
ist:
A. unzulässig, da qualitative Merkmale nicht numerisch codiert werden dürfen
B. weder vollständig noch disjunkt
C. vollständig und disjunkt
D. disjunkt, aber nicht vollständig
E. vollständig, aber nicht disjunkt
Aufgabe 2.10: Ausprägungsliste mit klassierten Daten
Das Merkmal X „Körpergrößesoll bei Studenten grob erfaßt werden. Dazu werden
Klassen mit der Breite 10 cm gebildet. Die Größe wird folgendermaßen erfaßt:
0: cm 150
X
1: cm 160cm 150
X
2: cm 071cm 160
X
3: cm 081cm 170
X
4: cm 091cm 180
X
5: cm 020cm 190
X
6: cm 200
X
Welche Aussage trifft zu?
A. Diese Codierung ist für praktische Untersuchungen zu grob und deshalb un-
brauchbar.
B. Die Ausprägungsliste ist vollständig und disjunkt.
C. Die Ausprägungsliste ist nicht vollständig.
D. Die Ausprägungsliste ist nicht disjunkt.
E. Die Codierung ermöglicht eine übersichtliche Darstellung der Körpergrößen ohne
Informationsverlust.
2 Theoretische Grundlagen 5
Aufgabe 2.1: Beobachtungseinheiten
Lösung: D (die Frauen, die das Medikament erhalten)
Beobachtungseinheiten sind die Personen oder Objekte, die beobachtet werden (also
die 50 Frauen; sie bilden die Stichprobe) und nicht die Personen, die beobachten (also
die Hebammen oder Ärzte, Antworten A und C sind deshalb falsch). Die Meßwerte für
die Geschwindigkeit, mit denen sich der Muttermund öffnet, sind die Merkmalsaus-
prägungen (Antwort B). Alle Frauen, denen das Medikament theoretisch helfen könnte,
bilden die Grundgesamtheit (Antwort E).
Aufgabe 2.2: Merkmalseigenschaften ASA-Gruppe
Lösung: C (qualitativ, ordinalskaliert)
Die Ausprägungen ASA I bis ASA V lassen sich in sinnvoller Weise in einer Reihen-
folge anordnen; deshalb ist dieses Merkmal ordinalskaliert. Es hat 5 Ausprägungen und
ist also kein Alternativmerkmal (das hat nur 2 Ausprägungen). Antwort A ist deshalb
falsch. Da die Ordinalskala ein höheres Niveau hat als die Nominalskala, ist auch die
Antwort B falsch. – Das ASA-Merkmal ist zwar diskret, aber nicht quantitativ (der
Abstand zwischen 2 Ausprägungen ist nicht definiert). Daher sind die Antwort D und
(erst recht) E falsch.
Aufgabe 2.3: Einfluß- und Zielgrößen
Lösung: A
Es wird der Einfluß des Zigarettenkonsums auf das Geburtsgewicht der Babys unter-
sucht – also ist das Merkmal 1 (Anzahl der Zigaretten) ein Faktor und das Merkmal 6
(Geburtsgewicht) eine Zielgröße (1a und 6d). Möglicherweise beeinflussen auch das
Alter der Mutter und deren Gewicht vor der Schwangerschaft das Geburtsgewicht des
Kindes – da diese beiden Merkmale zwar erfaßt, aber nicht ausgewertet werden, han-
delt es sich um Begleitmerkmale (2b und 3b). Die Merkmale 4 und 5 (Belastung und
Ernährungsweise der Mutter) beeinflussen auch die Zielgröße; sie werden jedoch hier
nicht berücksichtigt und sind deshalb als unverzerrende Störgrößen aufzufassen (4c und
5c).
Aufgabe 2.4: Merkmale des Blutes und deren Skalenniveaus
Lösung: B
Die ersten 3 Merkmale sind verhältnisskaliert (1d, 2d, 3d); man kann nämlich 2 Aus-
prägungen eines Merkmals in ein Verhältnis setzen wie etwa: 100.000 Thrombozyten
pro µl Blut sind doppelt so viele wie 50.000. Die Blutgruppe ist nur nominalskaliert
(4a). Die Temperatur in Celius-Graden ist zwar quantitativ, aber nur intervallskaliert
(5c). Siehe auch Beispiel 2.2 im Buch auf Seite 22.
62 Theoretische Grundlagen
Aufgabe 2.5: Diskrete und stetige Merkmale des Blutes
Lösung: D
Diskret heißt: das Merkmal hat nur abzählbar viele Ausprägungen. Dazu zählen alle
qualitativen Merkmale; also hier: Rhesusfaktor (2), Blutgruppe (3), Erkrankung an
Leukämie (6). Das Merkmal „Anzahl der Leukozyten pro µl Bluthat zwar sehr viele
Ausprägungen, aber nur ganzzahlige und ist deshalb ebenfalls diskret. – Die beiden
anderen Merkmale (pH-Wert, Hämatokrit) können innerhalb eines bestimmten Bereichs
jeden Wert annehmen und sind deshalb quantitativ stetig.
Aufgabe 2.6: Eigenschaften stetiger Merkmale
Lösung: B (beide Aussagen richtig, Verknüpfung falsch)
Der Glukosegehalt ist ein quantitativ-stetiges Merkmal (also nicht qualitativ). Demnach
sind die Aussagen 1 und 2 korrekt. Die Verknüpfung ist allerdings falsch. Aus der Tat-
sache, daß ein Merkmal nicht qualitativ (also quantitativ) ist, folgt nicht automatisch,
daß es auch stetig ist. Es gibt auch quantitativ-diskrete Merkmale (z. B. die Leuko-
zytenanzahl pro µl Blut).
Aufgabe 2.7: Skalentransformationen allgemein
Lösung: E (Verhältnisskala Ordinalskala)
Generell kann eine Skala nur auf eine andere Skala mit niedrigerem Niveau transfor-
miert werden. Daher sind die Antworten A und C falsch, und Antwort E ist richtig (die
Ordinalskala hat ein niedrigeres Niveau als die Verhältnisskala). – Ein stetiges Merkmal
setzt quantitative Daten voraus; also ist Antwort B falsch. Antwort D ist ebenfalls
falsch: die Transformation ist nicht immer möglich (eine Nominalskala kann nicht
transformiert werden). Ob eine Transformation sinnvoll ist, hängt von den speziellen
Rahmenbedingungen ab (siehe auch Seite 25 oben im Buch).
Aufgabe 2.8: Skalentransformation beim Eiweißgehalt
Lösung: C(die Aussage trifft nicht zu)
Vorsicht ! Gesucht ist hier die Aussage, die falsch ist. Das ist etwas verwirrend, aber
solche Aufgaben findet man hin und wieder in Klausuren. – Wenn man das Eiweiß in
mg/dl mißt, hat man ein verhältnisskaliertes Merkmal. Wenn man es nur mit den Aus-
prägungen pathologisch (ja/nein) erfaßt, hat man ein Alternativmerkmal (also ein no-
minalskaliertes). Antworten A und B sind also richtig. Auch die Aussage D ist leicht
nachvollziehbar. Da bei der einfachen Meßmethode sehr viel Informationen verloren
gehen, kann man die Daten natürlich auch nicht so gut analysieren – deshalb ist die
Antwort E korrekt. Falsch ist dagegen Antwort C. Ein einfacheres Meßverfahren kann
2 Theoretische Grundlagen 7
durchaus einen Informationsverlust rechtfertigen; im konkreten Einzelfall ist abzuwä-
gen, was wichtiger und der konkreten Fragestellung angemessen ist.
Aufgabe 2.9: Ausprägungsliste mit Laborwerten
Lösung: E(vollständig, aber nicht disjunkt)
Antwort A ist natürlich unsinnig, denn selbstverständlich dürfen qualitative Merkmale
numerisch codiert werden (wenn die Ausprägungsliste vollständig und disjunkt ist). –
Es ist klar, daß die Liste vollständig ist; wegen der Angabe 5 (sonstige path. Werte)
kann alles erfaßt werden. Sie ist aber nicht disjunkt, weil 2 Ausprägungen nicht unbe-
dingt unterscheidbar sind. So kann z. B. die Codierung 5 bedeuten: Blutwerte und Ge-
rinnungswerte pathologischoder andere Werte pathologisch. Dieses Problem kann
man umgehen, indem man statt der Zahlen 1–6 die 2er Potenzen 1, 2, 4, 8 etc. zur Co-
dierung verwendet.
Aufgabe 2.10: Ausprägungsliste mit klassierten Daten
Lösung: D(vollständig, aber nicht disjunkt)
Die Aussage A trifft so allgemein nicht zu. Ob diese unpräzise Erfassung brauchbar ist
oder nicht, hängt von der speziellen Fragestellung ab. – Die Liste ist vollständig, denn
mit den Codierungen 0 und 6 können auch die extremsten Körpergrößen erfaßt werden.
Allerdings ist sie nicht disjunkt – bei den Körpergrößen 150 cm, 160 cm etc. ist eine
eindeutige Zuordnung nicht möglich. Die Codierungen schließen sich gegenseitig nicht
aus. Bei allen Klasseneinteilungen muß deshalb darauf geachtet werden, daß Meßwerte,
die auf eine Klassengrenze fallen, eindeutig zugeordnet werden können.
83 Univariate Datenbeschreibung
3 Univariate Datenbeschreibung
Aufgabe 3.1: Balkendiagramm
Mit einem Balkendiagramm lassen sich Häufigkeiten graphisch darstellen. Für welche
Merkmale ist diese Darstellungsform geeignet?
A. generell für alle Merkmale
B. für alle diskreten Merkmale sowie für stetige Merkmale, wenn die Daten in Klassen
eingeteilt sind
C. nur für nominalskalierte Merkmale
D. nur für qualitative Merkmale
E. für alle diskreten Merkmale
Aufgabe 3.2: Relative Häufigkeiten – Darstellung
Im Rahmen einer klinischen Studie wird die Wirksamkeit einer therapeutischen Maß-
nahme an 22 Patienten untersucht. Bei 14
1=n Patienten ist die Therapie erfolgreich.
Welche Darstellung der entsprechenden relativen Häufigkeit ist am sinnvollsten?
A. %64
1=h
B. 63636,0
1=h
C. 22/14
1=h
D. 1
h liegt über 50 %.
E. 1
h beträgt zwischen 60 % und 70 %.
Aufgabe 3.3: Relative Häufigkeiten – Blutdruck
In einer Stichprobe von 200
=
n Personen werden die in der Tabelle aufgelisteten
Blutdruckwerte (in mmHg) gemessen.
diastolischer systolischer Blutdruck
Blutdruck 120
150121
150
>
Summe
80
27 13 3 43
10081
19 102 20 141
100
>
0 1 15 16
Summe 46 116 38 200
Hypertonie liege vor, wenn der systolische Blutdruck mehr als 150 mmHg oder der
diastolische mehr als 100 mmHg beträgt. Wie groß ist dann die relative Häufigkeit der
Patienten, die an Hypertonie leiden?
3 Univariate Datenbeschreibung 9
A. 15/200
B. 15/38
C. 15/16
D. 54/200
E. 39/200
Aufgabe 3.4: Klasseneinteilung – allgemein
Welche Aussage bzgl. klassierter Daten ist falsch?
A. Die Klassenbildung setzt ein quantitatives Merkmal voraus.
B. Die optimale Klassenanzahl ist abhängig vom Stichprobenumfang.
C. Durch die Klassenbildung geht Information verloren, dafür ist die Darstellung der
Häufigkeitsverteilung übersichtlicher.
D. Die Klassen müssen immer gleich breit sein.
E. An einem Historgramm sind charakteristische Eigenschaften der Merkmalsvertei-
lung (Lage, Streuung, Verteilungsform) erkennbar.
Aufgabe 3.5:* Klasseneinteilung – Berechnung des Mittelwerts
Die Daten zur Körpergröße von männlichen 50 Studenten seien in folgende Klassen
eingeteilt:
Klasse Grenzen absolute Häufigkeiten
1cm 160
2
1=n
2
(
]
cm 170cm, 160 18
2=n
3
(
]
cm 190cm, 180 20
3=n
4cm 190
>
10
4=n
Welche Aussage bzgl. des Mittelwerts trifft zu?
A. Man kann aus diesen Angaben einen Mittelwert ermitteln und erhält dabei genau
den selben Wert, der sich aus den nicht-klassierten Originalmeßwerten ergibt.
B. Man kann aus diesen Angaben einen Mittelwert berechnen, der jedoch mit einer
Ungenauigkeit behaftet ist.
C. Die Berechnung eines Mittelwerts ist wegen der offenen Restklassen nicht mög-
lich.
D. Die Berechnung eines Mittelwerts ist möglich, indem man als Klassenmitten für die
Restklassen 155 cm bzw. 195 cm ansetzt.
E. Die Berechnung eines Mittelwerts ist nicht möglich, da die Klassen unterschiedlich
breit sind.
10 3 Univariate Datenbeschreibung
Aufgabe 3.6: Empirische Verteilungsfunktion – allgemein
Welche Aussage bzgl. der empirischen Verteilungsfunktion )(xF ist falsch?
A. )(xF ist für alle
]
[
+,x definiert.
B. Zwischen dem kleinsten und dem größten Stichprobenwert wächst )(xF monoton
von 0 bis 1.
C. Ein Funktionswert )(xF gibt den relativen Anteil der Beobachtungen an, die
kleiner oder gleich x sind.
D. Ein Funktionswert )(xF gibt den relativen Anteil der Beobachtungen an, die grö-
ßer oder gleich x sind.
E. Es gilt: 1)(
=
xF für alle max
xx .
Aufgabe 3.7: Empirische Verteilungsfunktion bei klassierten Daten
Aus klassierten Daten wird die empirische Verteilungsfunktion bestimmt. Für ein be-
stimmtes 1
x gelte: 25,0)( 1=xF. Worum handelt es sich bei diesem 1
x?
A. Die relative Häufigkeit von 1
x beträgt 25%.
B. 1
x ist das empirisch ermittelte, untere Quartil.
C. 1
x ist das empirisch ermittelte, obere Quartil.
D. Dem 1
x kann keine dieser Eigenschaften zugewiesen werden.
E. Bei klassierten Daten kann die Verteilungsfunktion nicht bestimmt werden.
Aufgabe 3.8: Vergleich Mittelwert und Median
Welche der folgenden Aussagen ist falsch?
A. Der Mittelwert wird wesentlich stärker von Ausreißern beeinflußt als der Median.
B. Die Berechnung des Mittelwerts setzt ein quantitatives Merkmal voraus.
C. Der Mittelwert und der Median sind Lagemaße.
D. Wenn der Median wesentlich größer ist als der Mittelwert, ist die Verteilung schief.
E. Wenn die Berechnung des Medians erlaubt ist, kann auch der Mittelwert berechnet
werden.
Aufgabe 3.9: Bestimmung des empirischen Medians
69 Studenten schreiben eine Klausur, bei der maximal 10 Punkte zu erreichen sind. Die
Klausur gilt als bestanden, wenn mindestens 5 Punkte erreicht werden. Es ergibt sich
folgende Häufigkeitstabelle:
Anzahl Punkte
4
5678910
Häufigkeit 12 9 14 18 10 4 2
3 Univariate Datenbeschreibung 11
Der empirische Median ist:
A. 6
B. 6,5
C. 7
D. 14
E. nicht bestimmbar
Aufgabe 3.10: Eigenschaften des Medians
Welche Aussage ist richtig? – Der Median bleibt in jedem Fall unverändert, wenn
A. alle Werte außerhalb des Intervalls sx2
±
aus der Stichprobe entfernt werden
B. zum größten Wert eine positive Zahl addiert wird
C. alle Werte mit der gleichen Zahl multipliziert werden
D. zu allen Werten eine Konstante addiert wird
E. man einen Ausreißer wegläßt
Aufgabe 3.11: Lage- und Streuungsmaße
Im folgenden sind insgesamt 8 Lage- und Streuungsmaße aufgelistet:
a. Varianz d. Modus
b. Spannweite e. Standardabweichung
c. Variationskoeffizient f. Minimum
d. Quartilsabstand g. Maximum
Gefragt ist nach der Anzahl der Streuungsmaße.
A. 3
B. 4
C. 5
D. 6
E. 7
Aufgabe 3.12: Maßzahlen für die ASA-Risikogruppe
Jeder Patient, der sich im Klinikum M. einer Operation unterzieht, wird bezüglich des
Risikos eingestuft nach ASA I (geringes Risiko) bis ASA V (sehr schweres Risiko).
Welche Maßzahlen lassen sich bei diesem Merkmal berechnen?
a. Mittelwert d. Varianz
b. Median e. Standardabweichung
c. Modus f. Spannweite
12 3 Univariate Datenbeschreibung
A. alle angegebenen Maßzahlen können berechnet werden
B. nur a, d und e
C. nur c
D. nur b, c und f
E. nur a und b
Aufgabe 3.13: Maßzahlen für die Aufenthaltsdauer
Bei jedem Patienten, der mit einer bestimmten Diagnose in eine Klinik eingeliefert wird,
wird die Aufenthaltsdauer (in Tagen) ermittelt. Welche Maßzahlen lassen sich bei
diesem Merkmal berechnen?
a. Mittelwert d. Standardabweichung
b. Median e. Variationskoeffizient
c. Modus f. Spannweite
A. alle angegebenen Maßzahlen können berechnet werden
B. nur a und d
C. nur a, d und e
D. nur c und f
E. nur a, b und d
Aufgabe 3.14: Maßzahlen und Stichprobenumfang
Aus einer Stichprobe vom Umfang 10
=
n ermittelt man für ein quantitatives Merkmal
den Mittelwert, den Median, die Spannweite sowie die Varianz. Danach wählt man aus
derselben Grundgesamtheit weitere 10 Beobachtungseinheiten und berechnet die an-
gegebenen Maßzahlen aus der größeren Stichprobe des Umfangs 20
=
n. Welche
Maßzahlen können dabei in keinem Fall kleiner werden?
1. Mittelwert
2. Median
3. Spannweite
4. Summe der Abweichungsquadrate vom Mittelwert (Zähler der Varianz)
5. Varianz
A. keine der Maßzahlen 1–5 kann kleiner werden
B. nur 3 und 4 können nicht kleiner werden
C. nur 3, 4 und 5 können nicht kleiner werden
D. alle Maßzahlen können kleiner werden
E. diese Frage ist abhängig von dem Skalenniveau des Merkmals
3 Univariate Datenbeschreibung 13
Aufgabe 3.1: Balkendiagramm
Lösung: E(alle diskreten Merkmale)
Die Antworten A und B sind falsch: Voraussetzung für ein Balkendiagramm ist ein
diskretes Merkmal (bei stetigen Merkmalen mit klassierten Daten verwendet man ein
Histogramm). Das Merkmal, das durch ein Balkendiagramm dargestellt wird, kann
qualitativ (nominalskaliert oder ordinalskaliert) sein oder auch quantitativ-diskret. Die
Aussagen der Antworten C und D sind daher zu eingeschränkt und somit falsch. – Bei
quantitativen Merkmalen sind sowohl die Reihenfolge der Balken als auch deren Ab-
stand von Bedeutung; bei ordinalen Merkmalen ist nur die Reihenfolge interessant.
Aufgabe 3.2: Relative Häufigkeiten – Darstellung
Lösung: C(14/22)
Die richtige Lösung anzugeben mag für manchen Leser schwierig sein, denn eigentlich
ist keine einzige der Antworten A–E gänzlich falsch. Gefragt ist jedoch nicht nach einer
richtigen Häufigkeitsangabe, sondern nach einer sinnvollen. Bei 22 Beobach-
tungseinheiten würde man mit einer Prozentangabe oder einer Häufigkeit mit 4 Dezi-
malstellen eine Genauigkeit vortäuschen, die nicht vorhanden ist. Deshalb sind die
Antworten A und B nicht sinnvoll. Die Antworten D und E sind zwar richtig, aber zu
unpräzise. Die Angabe C ist dagegen präzise – und verheimlicht dennoch nicht, daß die
Berechnung der Häufigkeit auf einer relativ kleinen Anzahl von Beobachtungseinheiten
basiert.
Aufgabe 3.3: Relative Häufigkeiten – Blutgruppe
Lösung: E(39/200)
Das Wort oder“ wird bei statistischen Berechnungen (und in der Mathematik allge-
mein) im nicht-ausschließlichen Sinn gebraucht. Die 39 Patienten mit Hypertonie teilen
sich auf in 23 Patienten (systolischer Blutdruck > 150 mmHg, diastolischer normal),
einen Patienten (diastolischer Blutdruck > 100 mmHg, systolischer normal) und 15 Pa-
tienten (diastolischer Blutdruck > 100 mgHg und systolischer > 150 mmHg). Man muß
freilich aufpassen, daß man die 15 Patienten, die beide Kriterien bzgl. Hypertonie er-
füllen, nicht doppelt zählt – damit erhielte man das falsche Ergebnis in Antwort D.
Aufgabe 3.4: Klasseneinteilung – allgemein
Lösung: D(Aussage ist falsch)
Vorsicht: Hier ist nach einer falschen Aussage gefragt – und dies ist Aussage D. Es ist
zwar rechentechnisch günstig und übersichtlich, wenn die Klassen gleich breit sind –
dies ist aber keine unabdingbare Voraussetzung bei einer Klasseneinteilung. Manchmal
(etwa bei Ausreißern oder bei Randwerten, die nicht genau erfaßt sind) werden auch
14 3 Univariate Datenbeschreibung
Randklassen mit einer offenen Grenze verwendet. – Die Aussage A ist richtig (bei
qualitativen Daten kann man keine Klassen bilden), ebenso B (die optimale Klas-
senanzahl ist ungefähr n) und C (wegen der übersichtlichen Darstellung wird die
Klasseneinteilung ja vorgenommen). Auch die Aussage E ist korrekt: einen ersten
Eindruck bzgl. der Häufigkeitsverteilung gewinnt man über das Histogramm. Siehe
dazu auch Seite 38 ff. im Buch.
Aufgabe 3.5:* Klasseneinteilung – Berechnung des Mittelwerts
Lösung: C(Berechnung des Mittelwerts nicht möglich)
Die Berechnung eines Mittelwerts (ebenso der Varianz) bei klassierten Daten ist mög-
lich, falls keine offenen Restklassen vorliegen. Deshalb ist C richtig, A und B sind
falsch. Es ist auch nicht sinnvoll, irgendwelche Klassenmitten der offenene Restklassen
anzunehmen (daher ist D falsch). – Nur bei abgeschlossenen Klassen ist eine Ab-
schätzung des Mittelwerts aus den Klassenmitten möglich (auch wenn diese unter-
schiedlich breit sind, E ist falsch). Dieser Wert wäre allerdings etwas ungenau (d. h.
wenn keine offenen Restklassen vorlägen, wäre B die richtige Antwort).
Aufgabe 3.6: Empirische Verteilungsfunktion – allgemein
Lösung: D(Aussage ist falsch)
Die Aussagen A, B und E folgen sofort aus der Definition nach Formel (3.7) (Seite 36,
diskrete Merkmale) bzw. nach Formel (3.9) (Seite 41, stetige Merkmale). Nach der
Definition der empirischen Verteilungsfunktion ist auch Antwort C richtig, Aussage D
muß dann falsch sein.
Aufgabe 3.7: Empirische Verteilungsfunktion bei klassierten Daten
Lösung: B(1
x ist unteres Quartil)
Offensichtlicher Unsinn ist die Antwort E. Selbstverständlich kann man bei klassierten
Daten die Verteilungsfunktionen )(xF bestimmen, und zwar nach Formel (3.9) auf
Seite 41 im Buch. Diese Funktion gibt keine relativen Häufigkeiten an (deshalb ist auch
Antwort A falsch), sondern kumulative (also aufaddierte) Häufigkeiten. Wenn also gilt:
25,0)( 1=xF, dann heißt dies, daß 25% der Stichprobenwerte kleiner oder gleich 1
x
sind – demnach ist 1
x das untere Quartil (Antwort B). Für das obere Quartil (Antwort
C) gilt: 75,0)( 3=xF . Empirisch ermittelt" bedeutet hier: das Quartil wird aufgrund
von Stichprobenwerten bestimmt.
3 Univariate Datenbeschreibung 15
Aufgabe 3.8: Vergleich Mittelwert und Median
Lösung: E(Aussage ist falsch)
Der Mittelwert wird von Ausreißern stark beeinflußt, während Ausreißer bei der Be-
rechnung des Medians kaum eine Rolle spielen (siehe Bsp. 3.10, Seite 48); Antwort A
ist also richtig. Generell können bei quantitativen Merkmalen der Mittelwert und der
Median als Lagemaße berechnet werden (Antworten B und C). Wenn sich diese beiden
Maße stark unterscheiden, ist die Verteilung schief (Antwort D). – Bei ordinalskalierten
Merkmalen kann der Median berechnet werden, der Mittelwert dagegen nicht. Deshalb
ist Antwort E falsch. Achtung: vielfach wird bei ordinalskalierten Daten fälschlicher-
weise der Mittelwert angegeben – z. B. bei Schulnoten. Dann werden von den Daten
Informationen ausgewertet, die diese gar nicht enthalten. Siehe auch Bsp. 3.9 auf Seite
48.
Aufgabe 3.9: Bestimmung des empirischen Medians
Lösung: A(Median ist 6)
Der Stichprobenumfang ist 69
=
n, also ungerade. Mit Formel (3.15) ergibt sich für
den Median der Stichprobenwert mit dem Rang 35; dies ist 6. Entscheidend ist also nur
der mittlere Wert. Der Mittelwert könnte aus diesen Angaben nicht berechnet werden,
da dafür alle Stichprobenwerte erforderlich sind. Aus der Häufigkeitstabelle ist jedoch
nicht zu entnehmen, wie viele Studenten 0, 1, 2, 3 oder 4 Punkte erreicht haben.
Aufgabe 3.10: Eigenschaften des Medians
Lösung: B(zum größten Wert kann man eine Zahl addieren)
Wenn man zum größten Wert eine positive Zahl addiert, bleibt dies der größte Wert.
Dieser beeinflußt jedoch nicht den Median; deshalb ist B richtig. Wenn man jedoch
einen oder mehrere Werte aus der Stichprobe entfernt, ändert sich deren Umfang und
damit eventuell auch der Median (Antworten A und E sind deshalb falsch). Wenn man
alle Werte mit der gleichen Zahl multipliziert oder zu allen Werten eine Zahl addiert,
ändert sich der Median in der gleichen Weise (obgleich dessen Rang unverändert
bleibt). Deshalb sind auch die Antworten C und D falsch.
Aufgabe 3.11: Lage- und Streuungsmaße
Lösung: C(5 Streuungsmaße)
Streuungsmaße sind: die Varianz, die Spannweite, der Variationskoeffizient, der
Quartilsabstand und die Standardabweichung – sie beschreiben die Variabilität einer
Stichprobe. Der Modus, das Maximum und das Minimum beschreiben dagegen die
Lage der Stichprobenwerte.
16 3 Univariate Datenbeschreibung
Aufgabe 3.12: Maßzahlen für die ASA-Risikogruppe
Lösung: D(Median, Modus und Spannweite)
Es handelt sich bei der ASA-Risikogruppe um ein ordinalskaliertes Merkmal (siehe
Aufgabe 2.2, Seite 1). Bei dieser Merkmalsart können als Lagemaße nur der Median
und der Modus bestimmt werden (b und c), nicht jedoch der Mittelwert (siehe auch
Aufgabe 3.8). Als Streuungsmaß eignet sich nur die Spannweite (f); die Varianz und die
Standardabweichung setzen metrische Merkmale voraus.
Aufgabe 3.13: Maßzahlen für die Aufenthaltsdauer
Lösung: A(alle Maßzahlen können berechnet werden)
Es handelt sich bei der Aufenthaltsdauer um ein quantitativ-diskretes Merkmal mit
höchstem Niveau (Verhältnisskala). Deshalb können theoretisch alle Maßzahlen be-
rechnet werden. Ob diese Angaben immer sinnvoll sind, ist eine andere Frage. Oft
werden bei metrischen Merkmalen nur der Mittelwert und die Standardabweichung
angegeben; die anderen Maßzahlen nur bei besonderen Fragestellungen. Unbeliebt ist
vor allem die Spannweite, die nur die beiden extremsten Werte berücksichtigt und da-
her in der Regel ein verzerrtes Bild der Variabilität wiedergibt.
Aufgabe 3.14: Maßzahlen und Stichprobenumfang
Lösung: B(Spannweite und Summe der Abweichungsquadrate)
Es ist einleuchtend, daß eine größere Stichprobe bessere Schätzungen ermöglicht als
eine kleinere. Das bedeutet: die Maßzahlen Mittelwert, Median und Varianz liegen er-
wartungsgemäß näheram entsprechenden Parameter der Grundgesamtheit. „Näher
bedeutet dabei freilich nicht, daß z. B. der Mittelwert generell größer (oder generell
kleiner) wird. Anders verhält es sich bei der Spannweite: wenn die neuen 10 Beob-
achtungseinheiten ein größeres Maximum (oder ein kleineres Minimum) haben als die
ersten 10, vergrößert sich die Spannweite – ansonsten bleibt sie gleich. Da Abwei-
chungsquadrate niemals negativ sind, kann sich auch durch eine Erhöhung des Stich-
probenumfangs deren Summe nicht verkleinern – höchstens die Varianz, bei der durch
den Nenner )1(
n dividiert wird.
4 Bivariate Datenbeschreibung 17
4Bivariate Datenbeschreibung
Aufgabe 4.1: Punktwolke
Der Zusammenhang 2er metrischer Merkmale läßt sich durch eine Punktwolke gra-
phisch darstellen. Welche Informationen lassen sich nicht der Punktwolke entnehmen?
A. ob der Zusammenhang annähernd linear ist
B. ob Ausreißer vorhanden sind
C. ob der Zusammenhang stark oder eher schwach ist
D. ob der Zusammenhang gleich- oder gegensinnig ist
E. ob die beiden Merkmale in einem kausalen Zusammenhang stehen
Aufgabe 4.2: Kovarianz
Bei welchen Skalenniveaus ist die Berechnung der Kovarianz erlaubt?
A. Bei 2 Merkmalen mit beliebigem Skalenniveau
B. Beide Merkmale müssen verhältnisskaliert sein.
C. Es genügt, wenn beide Merkmale ordinalskaliert sind.
D. Es genügt, wenn mindestens 1 Merkmal metrisch skaliert ist.
E. Beide Merkmale müssen metrisch skaliert sein.
Aufgabe 4.3: Wertebereich des Korrelationskoeffizienten
Welches Intervall umfaßt alle Zahlenwerte, die ein empirischer Korrelationskoeffizient r
annehmen kann?
A.
]
[
+,
B.
[
]
1,0
C.
[
[
+,0
D.
]
[
1,1+
E.
[
]
1,1+
Aufgabe 4.4: Interpretation eines Korrelationskoeffizienten
Welcher empirische Korrelationskoeffizient nach Pearson bezeichnet den stärksten (li-
nearen) Zusammenhang?
A. 0
=
r
B. 8,0
=
r
C. 95,0
=
r
D. 2,1
=
r
E. Dieses Maß ist nicht geeignet, um die Stärke eines Zusammenhangs zu quanti-
fizieren.
18 4 Bivariate Datenbeschreibung
Aufgabe 4.5: Wertebereich des Bestimmtheitsmaßes
Welches Intervall umfaßt alle Zahlenwerte, die das Bestimmtheitsmaß annehmen kann?
A.
]
[
+,
B.
[
]
1,0
C.
[
]
1,1+
D.
]
[
1,1+
E.
[
[
+,0
Aufgabe 4.6: Regressionsgerade
Eine Regressionsgerade habe die Form: xy
+
=
3,08,0. Was folgt daraus für den
dargestellten Zusammenhang?
A. Der Zusammenhang ist gegensinnig.
B. Der Zusammenhang ist gleichsinnig.
C. Der Korrelationskoeffizient beträgt .8,0
=
r
D. Der Korrelationskoeffizient beträgt .3,0
+
=
r
E. Keine dieser Aussagen läßt sich herleiten.
Aufgabe 4.7: Regressionskoeffizient
Der Regressionskoeffizient ist
A. die Steigung der Regressionsgeraden
B. der Schwerpunkt der Punktwolke
C. der Schnittpunkt der Regressionsgeraden mit der y-Achse
D. immer eine Zahl zwischen 0 und 1
E. ein Punkt auf der Regressionsgeraden
Aufgabe 4.8: Korrelationskoeffizient und Regressionsgerade
Ein Korrelationskoeffizient betrage 2,0
=
r. Was folgt daraus für die Regressionsge-
rade?
A. Die Steigung der Regressionsgeraden ist positiv.
B. Die Steigung der Regressionsgeraden ist negativ.
C. Die Steigung der Regressionsgeraden beträgt 0,2.
D. Der y-Achsenabschnitt beträgt 0,2.
E. Da der Zusammenhang sehr schwach ist, ist die Darstellung durch eine Regressi-
onsgerade nicht erlaubt.
4 Bivariate Datenbeschreibung 19
Aufgabe 4.9: Vergleich zweier Meßverfahren
Eine neue Meßmethode Y wird mit einer Referenzmethode X verglichen. Womit läßt
sich die Güte der neuen Methode beurteilen?
A. durch den Regressionskoeffizienten
B. durch den Korrelationskoeffizienten
C. durch das Bestimmtheitsmaß
D. durch die Regressionsgerade und den Korrelationskoeffizienten
E. durch den Schwerpunkt der Punktwolke
Aufgabe 4.10: Prognostizieren mit der Regressionsgeraden
Ein Patient mit Bluthochdruck erhält eine Therapie über 15 Tage, die danach abgebro-
chen wird. Bezüglich der Änderung des systolischen Blutdrucks über die Zeit wird ein
Korrelationskoeffizient 89,0
=
r und die Regressionsgerade xy
=
4180 ermittelt
(wobei
x
die Behandlungstage und
y
die Blutdruckwerte in mmHg sind). Welche der
folgenden Aussagen lassen sich aus diesen Informationen schlußfolgern?
1. Der Blutdruck sinkt während der Therapie um durchschnittlich 0,89 mmHg pro
Tag.
2. Der Blutdruck sinkt während der Therapie um durchschnittlich 4 mmHg pro Tag.
3. Der Schätzwert für den letzten Tag der Therapie beträgt 120 mmHg.
4. Zu Beginn der Therapie hatte der Patient einen Blutdruck von etwa 180 mmHg.
5. Am 20. Tag nach Beginn der Therapie ist bei dem Patienten ein Blutdruck von 100
mmHg zu erwarten.
A. nur die Aussage 2 ist herleitbar
B. nur die Aussage 1 ist herleitbar
C. nur die Aussagen 2, 3 und 4 sind herleitbar
D. die Aussagen 2, 3, 4 und 5 sind herleitbar
E. die Aussagen 1, 3, 4 und 5 sind herleitbar
Aufgabe 4.11: Geeignetes Zusammenhangsmaß
Von zwei metrisch skalierten Merkmalen ist nur bekannt, daß der Zusammenhang mo-
noton steigend ist. Welches Maß eignet sich zur Quantifizierung der Stärke dieses Zu-
sammenhangs?
A. die Kovarianz
B. der Korrelationskoeffizient nach Pearson
C. der Korrelationskoeffizient nach Spearman
D. das Produkt der beiden Standardabweichungen
E. keine der Angaben aus A–D
20 4 Bivariate Datenbeschreibung
Aufgabe 4.12: Wertebereiche
Wie viele der folgenden 10 Maßzahlen können niemals negative Werte annehmen?
Spannweite – Varianz – Standardabweichung – Minimum – Maximum – Modus –
Median – Korrelationskoeffizient – Kovarianz – Bestimmtheitsmaß
A. alle 10
B. nur 7
C. nur 5
D. nur 4
E. nur 2
Aufgabe 4.13: Zusammenhang zwischen Körpergröße und Gewicht
Beurteilen Sie die folgende Aussagen:
1. Der Korrelationskoeffizient, der den Zusammenhang zwischen Körpergröße und
Körpergewicht von männlichen Erwachsenen quantifiziert, ist positiv, denn
2. diese beiden Merkmale können nur positive Werte annehmen.
Aussage 1 Aussage 2 Verknüpfung
A. richtig richtig richtig
B. richtig richtig falsch
C. richtig falsch –––
D. falsch richtig –––
E. falsch falsch
Aufgabe 4.14: Abhängiges und unabhängiges Merkmal
Der Zusammenhang zwischen Körpergröße und Gewicht bei erwachsenen Frauen im
Alter von 20 bis 40 Jahren soll durch eine Regressionsgleichung beschrieben werden.
Welches Merkmal sollte sinnvollerweise als das unabhängige x-Merkmal und welches
als das abhängige y-Merkmal aufgefaßt werden?
A. Dieser Zusammenhang läßt sich nicht durch eine Regressionsgleichung beschrei-
ben.
B. Es ist vollkommen gleichgültig, welches der beiden Merkmale als abhängig bzw.
unabhängig angesehen wird.
C. Das Gewicht sollte als das unabhängige x-Merkmal gewählt werden.
D. Die Größe sollte als das unabhängige x-Merkmal gewählt werden.
E. Man berechnet 2mal den Korrelationskoeffizienten (einmal mit der Größe und
einmal mit dem Gewicht als unabhängigem x-Merkmal). Der größere Koeffizient
liefert die Entscheidung.
4 Bivariate Datenbeschreibung 21
Aufgabe 4.1: Punktwolke
Lösung: E(kausaler Zusammenhang nicht erkennbar)
Die Darstellung 2er Merkmale mittels einer Punktwolke liefert sehr wertvolle Infor-
mationen (Antworten A–D). Man sieht, ob die Punkte um eine Gerade liegen (ob der
Zusammenhang annähernd linear ist, Antwort A). Ausreißer sind auf einen Blick er-
kennbar (Antwort B). Wenn die Punkte nahe an der Geraden liegen, ist der Zusam-
menhang stark, je weiter die Punkte streuen, desto schwächer ist er (Antwort C). Wenn
die Geradensteigung positiv ist, ist der Zusammenhang gleichsinnig, bei negativer
Steigung gegensinnig (Antwort D). Siehe dazu auch Seiten 72ff. im Buch. Ob und wie
die Merkmale kausal zusammenhängen, ist allerdings anhand der Punktwolke nicht
nachvollziehbar. Man kann eine wunderschöne Punktwolke erstellen, indem man für
jedes Jahr dieses Jahrhunderts das Storchenaufkommen und die Geburtenhäufigkeit als
einen Punkt in ein Koordinatenssystem einzeichnet. Der Punktwolke ist es egal, ob der
Zusammenhang sachlich begründet und kausal ist, oder ob es sich um eine Nonsens-
Korrelation handelt.
Aufgabe 4.2: Kovarianz
Lösung: E(beide Merkmale metrisch)
Die Berechnung der Kovarianz basiert auf den Mittelwerten
x
und
y
(siehe Formel
(4.4), Seite 74). Dazu müssen beide Merkmale metrisch sein; deshalb sind Antworten
A, C und D falsch. Es genügt, wenn sie intervallskaliert sind; in der Antwort B (ver-
hältnisskaliert) wird zuviel verlangt.
Aufgabe 4.3: Wertebereich des Korrelationskoeffizienten
Lösung: E
[
]
1,1+
Es ist ja gerade die herausragende Eigenschaft des Korrelationskoeffizienten, daß er
normiert ist und deshalb nur Werte zwischen –1 und +1 annehmen kann (und damit
sehr gut interpretierbar ist). Die Grenzen sind eingeschlossen. Wenn der Zusammen-
hang funktional ist und exakt durch eine Geradengleichung beschrieben werden kann
(was zwar praktisch kaum vorkommt, aber theoretisch möglich ist), beträgt der Korre-
lationskoeffizient
1
=
r
oder
1
=
r
. Bei stochastischen Zusammenhängen hat er einen
Betrag, der kleiner als 1 ist.
Aufgabe 4.4: Interpretation eines Korrelationskoeffizienten
Lösung: C95,0
=
r
Barer Unsinn ist die Aussage E: dieses Maß ist sehr gut geeignet, um einen linearen
Zusammenhang zu beschreiben. Auch die Aussage D erweist sich sofort als falsch: r
22 4 Bivariate Datenbeschreibung
kann nur Werte annehmen, deren Betrag höchstens 1 ist. Nun ist bekannt: je näher der
Betrag von r bei 1 liegt, desto stärker ist der Zusammenhang. Deshalb ist ein Zusam-
menhang mit 95,0
=
r stärker als einer mit 8,0
=
r (bzgl. der Stärke spielt das Vorzei-
chen keine Rolle). Die Antwort A ( 0
=
r) bezieht sich auf 2 Merkmale, bei denen
überhaupt kein linearer Zusammenhang erkennbar ist.
Aufgabe 4.5: Wertebereich des Bestimmtheitsmaßes
Lösung: B
Dazu muß man wissen, daß das Bestimmtheitsmaß durch 2
r
quantifiziert wird (Formel
(4.12) auf Seite 88). Da sich r zwischen –1 und +1 erstreckt, hat 2
r
einen Wertebereich
zwischen 0 und 1 (Grenzen eingeschlossen).
Aufgabe 4.6: Regressionsgerade
Lösung: B
Wenn die Steigung der Regressionsgerade wie hier mit 0,3 positiv ist, ist der Zusam-
menhang gleichsinnig (Antwort A falsch, B richtig) – weitergehende Aussagen sind
nicht möglich. Man weiß also nur, daß der Korrelationskoeffizient positiv ist; die Glei-
chung der Regressionsgeraden enthält keine Aussagen über dessen Betrag.
Aufgabe 4.7: Regressionskoeffizient
Lösung: A(Steigung der Regressionsgeraden)
Dies ist eine reine Definitionssache (siehe Seite 84). Der Wertebereich des Regressi-
onskoeffizienten ist nicht eingeschränkt, mit anderen Worten: die Steigung der Regres-
sionsgeraden kann beliebig steil oder schwach sein. Sie beschreibt die Art des Zusam-
menhangs, der Korrelationskoeffizient dessen Stärke.
Aufgabe 4.8: Korrelationskoeffizient und Regressionsgerade
Lösung: A(Steigung der Regressionsgeraden ist positiv)
Der Korrelationskoeffizient und die Steigung der Regressionsgeraden haben dasselbe
Vorzeichen (siehe auch Aufgabe 4.6). Wenn man also weiß, daß 2,0
=
r, kann man auf
Antwort A schließen – spezifischere Aussagen bzgl. der Geradensteigung oder des y-
Achsenabschnitts sind jedoch nicht möglich.
4 Bivariate Datenbeschreibung 23
Aufgabe 4.9: Vergleich zweier Meßverfahren
Lösung: D(Korrelationskoeffizient und Regressionsgerade)
Von einem neuen Meßverfahren erwartet man, daß es dieselben Werte mißt wie eine
bekannte Referenzmethode (abgesehen von geringen, zufällig bedingten Abweichun-
gen). Dann müßte der Korrelationskoeffizient
1
r
betragen (er sollte nur wenig klei-
ner sein). Das allein reicht jedoch nicht aus, um die Güte eines neuen Verfahrens zu
bestimmen. Auch bei einem systematischen Fehler könnte sich ein Korrelationskoeffi-
zient nahe bei 1 ergeben. Es ist deshalb wichtig, auch die Regressionsgerade zu ermit-
teln; für sie müßte gelten:
x
y
. Folgendes Beispiel sei genannt: wenn man die Kör-
pergröße mehrerer Personen mit einem normalen Maßband x und einem um exakt 10
cm verkürzten Maßband y mißt, ergibt sich als Regressionsgerade: 10
+
xy und als
Korrelationskoeffizient
1
r
. Am Korrelationskoeffizienten ist die systematische Ab-
weichung also nicht erkennbar.
Aufgabe 4.10: Prognostizieren mit der Regressionsgeraden
Lösung: C(Aussagen 2, 3 und 4 sind herleitbar)
Die Regressionsgerade beschreibt die Art des Zusammenhangs, in diesem Fall: der
Blutdruck sinkt um 4 mmHg pro Tag (Aussage 2 richtig). Der Korrelationskoeffizient
89,0
=
r beschreibt die Stärke des Zusammenhangs, nicht dessen Art (deshalb ist
Aussage 1 falsch). Man erhält über die Gleichung der Regressionsgeraden für 15
=
x:
mmHg 120mmHg )154180(
=
=
y (Aussage 3). Zu Beginn der Therapie ergibt sich
mit 0
=
x: mmHg 180
=
y (Aussage 4). Es ist aber nicht erlaubt, über den Beobach-
tungsbereich hinaus zu extrapolieren. Die 5. Aussage ist deshalb nicht mehr herleitbar.
Eine solche Vorgehensweise würde unsinnige Werte liefern (man setze mal spaßeshal-
ber in die Regressionsgerade ein: 50
=
x).
Aufgabe 4.11: Geeignetes Zusammenhangsmaß
Lösung: C
Wenn man nicht genau weiß, ob ein Zusammenhang zwischen 2 metrischen Merkmalen
linear ist, sollte man weder die Kovarianz noch der Korrelationskoeffizienten nach
Pearson (der ja auf der Kovarinz basiert) berechnen. Diese beiden Maßzahlen eignen
sich nur zur Darstellung eines linearen Zusammenhangs. Die Antworten A und B sind
somit falsch, ebenso die Antwort D (das Produkt der Standardabweichungen ist gene-
rell kein Maß für die Stärke eines Zusammenhangs). Einen Ausweg liefert der Korre-
lationskoeffizient nach Spearman, der schwächere Voraussetzungen hat (der Zusam-
menhang muß nur monoton, nicht unbedingt linear sein).
24 4 Bivariate Datenbeschreibung
Aufgabe 4.12: Wertebereiche
Lösung: D(4 Maßzahlen sind nicht negativ)
Diese sind: Spannweite, Varianz, Standardabweichung und Bestimmtheitsmaß. Die er-
sten 3 sind nur dann gleich 0, wenn alle Stichprobenwerte übereinstimmen; ansonsten
sind sie positiv. Das ergibt sich aus der Definition dieser Kenngrößen. Das Bestimmt-
heitsmaß ist das Quadrat 2
r
und kann deshalb niemals negativ sein. Dagegen können –
wenn die Stichprobe negative Werte enthält – das Minimum, das Maximum, der Modus
und der Median negativ sein. Der Korrelationskoeffizient und die Kovarianz sind
negativ, falls der Zusammenhang gegensinnig ist.
Aufgabe 4.13: Zusammenhang zwischen Körpergröße und Gewicht
Lösung: B(beide Aussagen richtig, Verknüpfung falsch)
Der Zusammenhang ist gleichsinnig, demnach ist der Korrelationskoeffizient positiv
(große Leute wiegen viel, kleine eher weniger). Die Werte der Körpergröße und des
Gewicht sind immer positiv. Also sind die Aussagen 1 und 2 richtig; allerdings nicht
deren Verknüpfung. Die Aussage 2 enthält keinerlei Information bzgl. des Korrelati-
onskoeffizienten; dieser kann positiv oder negativ sein (siehe auch Beispiel auf Seite 73
im Buch, Zusammenhang zwischen Isofluran und arteriellem Blutdruck).
Aufgabe 4.14: Abhängiges und unabhängiges Merkmal
Lösung: D(die Größe sollte das unabhängige Merkmal sein)
Antwort A ist Unsinn: natürlich läßt sich der Zusammenhang durch eine Regressions-
gleichung (dies ist ein allgemeinerer Begriff als Regressionsgerade) beschreiben. Dabei
ist es keineswegs gleichgültig, welches das x- und welches das y-Merkmal ist (Antwort
B ist also auch falsch). Aus dem x-Merkmal kann das y-Merkmal anhand der
Regressionsgleichung prognostiziert werden; daher ist im Einzelfall aufgrund fachlicher
Überlegungen diese Frage zu beantworten. Im vorliegenden Fall ist die Größe quasi
konstant vorgegeben; sie beeinflußt in gewissem Maße das Gewicht. Umgekehrt ist dies
nicht der Fall: Frauen können ihr Gewicht zwar beeinflussen; dadurch ändert sich
jedoch nicht deren Größe. Durch eine Hungerkur nimmt man ab, wird deshalb aber
nicht kleiner. Während einer Schwangerschaft nimmt man zu, ohne dabei zu wachsen.
Aus diesen Überlegungen folgt, daß Antwort C falsch und D richtig ist. Schließlich sei
noch auf die sinnlose Aussage von E hingewiesen: für die Berechnung des Korrelati-
onskoeffizienten ist es belanglos, welches der beiden Merkmale abhängig bzw. unab-
hängig ist.
5 Grundlagen der Wahrscheinlichkeitsrechnung 25
Teil II: Wahrscheinlichkeitsrechnung
5 Grundlagen der Wahrscheinlichkeitsrechnung
Aufgabe 5.1: Wertebereich einer Wahrscheinlichkeit
Geben Sie das kleinste Intervall an, das den Wertebereich einer Wahrscheinlichkeit
enthält.
A.
(
)
+,
B.
[
]
1,1+
C.
[
)
,0
D.
[
]
1,0
E.
(
)
1,0
Aufgabe 5.2: Unabhängige Ereignisse
Die folgenden Sätze beinhalten jeweils 2 Ereignisse. Bei welchen Aussagen sind die Er-
eignisse unabhängig voneinander?
1. Der systolische Blutdruck bei Patient M. betrug 180 mmHg vor einer blut-
drucksenkenden Therapie und 145 mmHg danach.
2. Das 1. Kind einer Familie ist weiblich, das 2. ebenfalls (keine eineiigen Zwil-
linge).
3. Das Geschlecht eines Kindes ist männlich, das Geschlecht der Mutter weiblich.
4. Ein männlicher Patient erkrankt an Hämophilie.
5. Eine Person hat Blutgruppe A und Rhesusfaktor negativ.
6. Ein Vater ist 195 cm groß, dessen Sohn nur 182 cm.
7. Eine 20jährige Frau erkrankt an einem Mammakarzinom.
A. bei allen Aussagen
B. bei keiner Aussage
C. nur bei 2 und 5
D. nur bei 2, 3 und 5
E. nur bei 2, 5 und 6
Aufgabe 5.3: Wahrscheinlichkeit beim Kinderkriegen
Ein Vater von 4 Jungen plant mit seiner Partnerin ein weiteres Kind und wünscht sich
sehnsüchtig ein Mädchen. Wie groß ist die Wahrscheinlichkeit p, daß sein Wunsch in
Erfüllung geht? Wir nehmen an, daß mit der Wahrscheinlichkeit 1/2 ein neugeborenes
Kind männlich ist, und daß keine Mehrlinge geboren werden.
26 5 Grundlagen der Wahrscheinlichkeitsrechnung
A. 32/31
=
p
B. 16/15
=
p
C. 2/1
=
p
D. 32/1
=
p
E. Die Wahrscheinlichkeit kann aus den vorliegenden Angaben nicht ermittelt
werden.
Aufgabe 5.4: Komplementäre Ereignisse
Bei wie vielen Ereignispaaren handelt es sich um komplementäre Ereignisse?
1. Rhesusfaktor positiv – Rhesusfaktor negativ
2. Blutgruppe A – Blutgruppe B
3. Geschlecht männlich – Geschlecht weiblich
4. schwanger – Geschlecht männlich
5. Würfeln: Augenzahl 6 – Augenzahl
5
6. herzkrank – an Diabetes erkrankt
A. 6
B. 5
C. 3
D. 2
E. 0
Aufgabe 5.5: Additionssatz
A und B seien 2 beliebige Ereignisse. Welche Aussage gilt generell?
A. )(2)()()( BAPBPAPBAP
+
=
B. )()()()( BAPBPAPBAP
+
=
C. )()()( BPAPBAP
+
=
D. )()()()()( BPAPBPAPBAP
+
=
E. )()( APBAP
>
Aufgabe 5.6: Wahrscheinlichkeiten bei diagnostischen Verfahren
In einer gynäkologischen Klinik wird routinemäßig jede Frau auf das Vorhandenseins
eines Mammakarzinoms untersucht. Dabei werden die Mammographie und die Palpa-
tion angewandt; die Methoden werden unabhängig voneinander durchgeführt. Die
Wahrscheinlichkeit bei einer erkrankten Frau, ein Karzinom mit Mammographie zu
entdecken, betrage 90%; bei der Palpation liegt diese Wahrscheinlichkeit nur bei 60%.
Wie groß ist dann die Wahrscheinlichkeit, daß ein vorhandenes Karzinom bei einer Frau
nicht entdeckt wird?
5 Grundlagen der Wahrscheinlichkeitsrechnung 27
A. 1%
B. 4%
C. 10%
D. 40%
E. 45%
Aufgabe 5.7: Krankheiten und Wahrscheinlichkeit
In einer Klinik betrage der Anteil der an Diabetes mellitus erkrankten Patienten 20%.
30% der Patienten leiden an einer Herzerkrankung; 5% haben beide Krankheiten. Wie
groß ist der Anteil der Patienten, die entweder Diabetes- oder herzkrank sind?
A. 20%
B. 30%
C. 45%
D. 40%
E. 50%
Aufgabe 5.8: 10 Merkmale eines Patienten
Bei einem bestimmten Patienten werden die Werte von 10 medizinisch relevanten
Merkmalen erhoben. Die Wahrscheinlichkeit, daß ein Meßwert innerhalb des Normbe-
reichs liegt, beträgt für jedes dieser Merkmale 95%. Der Einfachheit halber nehmen wir
an, daß die Ereignisse unabhängig voneinander sind. Wie groß ist dann die Wahr-
scheinlichkeit, daß ein Wert außerhalb des Normbereichs liegt?
A. 40,095,01 10
B. 05,0
C. 03,005,095,0 9
D. 32,005,095,010 9
E. 50,005,010
=
Aufgabe 5.9: Multiplikationssatz
Wann gilt: )()|(APBAP
=
?
A. Diese Gleichung ist generell richtig.
B. Diese Gleichung gilt nur dann, wenn A und B unabhängige Ereignisse sind.
C. Diese Gleichung gilt nur dann, wenn A und B disjunkte Ereignisse sind.
D. Diese Gleichung gilt nur dann, wenn A und B komplementäre Ereignisse sind.
E. Diese Gleichung gilt generell nie.
28 5 Grundlagen der Wahrscheinlichkeitsrechnung
Aufgabe 5.10: Semmelweis – Berechnen einer Wahrscheinlichkeit
Ignaz Semmelweis ermittelte für einen Monat des Jahres 1846, daß in einer Abteilung
des Wiener Gebärhauses 24% der gebärenden Frauen an Kindbettfieber erkrankten. Die
Wahrscheinlichkeit, an Kindbettfieber zu sterben, betrug damals 80%. Wie groß war
dann die Wahrscheinlichkeit für eine Frau, an Kindbettfieber zu erkranken und daran zu
sterben?
A. Um diese Frage zu beantworten, bedarf es weiterer Informationen.
B. 104%
C. 80%
D. 24%
E. etwa 19%
Aufgabe 5.11: Karzinom am Versuchstier
Bei einem Versuchstier werden 2 Stellen am Rücken mit 2 unterschiedlichen Karzino-
genen bepinselt. Die Wahrscheinlichkeit, ein Karzinom zu erzeugen, betrage 0,3 bzw.
0,8. Die Ereignisse seien unabhängig. Wie groß ist die Wahrscheinlichkeit, daß minde-
stens ein Karzinom entsteht?
A. 1,1
B. 0,8
C. 0,3
D. 0,24
E. 0,86
Aufgabe 5.12: Erwartungswert beim Würfeln
Mit einem roten und einem blauen Würfel wird gleichzeitig gewürfelt. Die Augenzahl X
des roten Würfels wird verdoppelt; davon wird die Augenzahl Y des blauen Würfels
subtrahiert. Was ist der Erwartungswert der so berechneten Zufallsvariable?
A. 7
B. 10,5
C. 2
D. 3,5
E. Dieser Wert ist ohne zusätzliche Informationen nicht zu berechnen.
5 Grundlagen der Wahrscheinlichkeitsrechnung 29
Aufgabe 5.13: Transformation einer Zufallsvariablen
Eine stetige Zufallsvariable X habe den Erwartungswert µ und die Varianz 2
σ. Alle
Werte von X werden nun transformiert nach baXX
+
(a und b sind konstante
Zahlen). Wie ändern sich dadurch der Erwartungswert und die Varianz?
A. babaXE
+
µ
=
+
)( , 22
)(Var σ=+abaX
B. babaXE
+
µ
=
+
)( , babaX +σ=+2
)(Var
C. babaXE
+
µ
=
+
)( , babaX
+
σ
=
+
)(Var
D.
µ
=
+
abaXE)( ,
σ
=
+
abaX )(Var
E.
µ
=
+
)( baXE, 2
)(Var σ=+baX
Aufgabe 5.14: Empirisches Ermitteln einer Wahrscheinlichkeit
In der medizinischen Forschung wird eine Wahrscheinlichkeit in der Regel empirisch
ermittelt; d. h. eine hinreichend große Stichprobe wird bezüglich eines Merkmals unter-
sucht. Der Wert der relativen Häufigkeit einer Ausprägung wird dann als Nähe-
rungswert für die entsprechende Wahrscheinlichkeit zugrunde gelegt. Wonach ist dieses
Vorgehen gerechtfertigt?
A. Dieses Vorgehen hat zwar eine lange Tradition, ist aber in keiner Weise ge-
rechtfertigt.
B. Nach den Axiomen von Kolmogoroff.
C. Nach dem Gesetz der großen Zahl.
D. Nach der Definition der Wahrscheinlichkeit von Laplace.
E. Nach der Tschebyscheff'schen Ungleichung.
30 5 Grundlagen der Wahrscheinlichkeitsrechnung
Aufgabe 5.1: Wertebereich einer Wahrscheinlichkeit
Lösung: D(alle Werte zwischen 0 und 1)
Eine Wahrscheinlichkeit kann – wie eine relative Häufigkeit – alle Werte zwischen 0
und 1 (inklusive der Grenzen) annehmen, aber keine Werte außerhalb dieses Bereichs.
Da nach dem kleinsten Intervall, das diesen Bereich enthält, gefragt ist, ist Antwort D
korrekt.
Aufgabe 5.2: Unabhängige Ereignisse
Lösung: D(nur 2, 3 und 5)
Ob 2 Ereignisse abhängig oder unabhängig voneinander sind, ergibt sich aus sachlogi-
schen Überlegungen. Es bedarf keiner langen Ausführungen, daß das Geschlecht eines
Kindes nicht das Geschlecht des nachfolgenden Geschwisters beeinflußt (2) und
ebenso, daß das Geschlecht eines Babys unabhängig ist von der Tatsache, daß seine
Mutter weiblich ist (3). Ein Medizinstudent sollte wissen, daß die Wahrscheinlichkeit
für Blutgruppe A ungefähr 42% beträgt, unabhängig davon, ob der Rhesusfaktor posi-
tiv oder negativ ist (5). – Alle anderen Ereignispaare sind jedoch abhängig voneinander.
Dies ergibt sich aufgrund einfacher Überlegungen und minimaler medizinischer
Fachkenntnisse.
Aufgabe 5.3: Wahrscheinlichkeit beim Kinderkriegen
Lösung: C(p = 1/2)
Die Wahrscheinlichkeit, daß ein neugeborenes Kind weiblich ist, beträgt bei jeder Ge-
burt p = 1/2. Also ist auch das 5. Kind mit 50%-iger Wahrscheinlichkeit ein Mädchen,
unabhängig davon, welches Geschlecht die älteren 4 Geschwister haben. Eigentlich
ganz einfach – dennoch löst die Antwort immer wieder Erstaunen aus, so nach dem
Motto: bei fast allen Familien mit 5 Kindern ist auch ein Mädchen dabei (die Wahr-
scheinlichkeit dafür beträgt in der Tat nur 31/32, Antwort A). Aber: hier ist nicht ge-
fragt nach der Wahrscheinlichkeit, daß mindestens ein Kind weiblich ist, sondern nach
der Wahrscheinlichkeit, daß nur das 5. Kind weiblich ist.
Aufgabe 5.4: Komplementäre Ereignisse
Lösung: C(Anzahl 3)
Komplementäre Ereignisse sind disjunkt und ergänzen sich zum Ereignisraum. Disjunkt
sind alle Ereignispaare 1–5 (d. h. die beiden Ereignisse schließen sich gegenseitig aus).
Bei den Paaren 1, 3 und 5 ist leicht nachvollziehbar, daß eines der beiden Ereignisse
zutreffen muß. Dies trifft jedoch nicht zu für die Paare 2 und 4 (es gibt andere Blut-
gruppen als A und B und auch Personen, die weder männlich noch schwanger sind). –
5 Grundlagen der Wahrscheinlichkeitsrechnung 31
Das 6. Paar (Diabetes- und herzkrank) ist leider nicht disjunkt und damit auch nicht
komplementär.
Aufgabe 5.5: Additionssatz
Lösung: B
Der Additionssatz in seiner allgemeinen Form ist die Gleichung unter B. Er beschreibt
die Wahrscheinlichkeit, daß das Ereignis A, das Ereignis B oder auch beide Ereignisse
eintreten (siehe Seite 106 im Buch). Die Gleichungen A, C und D sind Spezialformen.
Die Gleichung unter A quantifiziert die Wahrscheinlichkeit, daß entweder A oder B
eintritt (d. h. nur ein Ereignis, aber nicht beide zusammen). Wenn A und B disjunkt
sind, ist die Antwort C richtig; falls A und B unabhängig sind, gilt D (siehe Seite 108).
Auch die Ungleichung unter E ist nicht immer korrekt: falls B in A enthalten ist (z. B. A
weiblich und B schwanger), gilt )()( APBAP
=
.
Aufgabe 5.6: Wahrscheinlichkeiten bei diagnostischen Verfahren
Lösung: B(4%)
Die Wahrscheinlichkeit, daß ein Karzinom entdeckt wird, berechnet sich nach dem
Additionssatz für unabhängige Ereignisse (Seite 108) als: 96,06,09,06,09,0
=
+
.
Für die Wahrscheinlichkeit des komplementären Ereignisses (das Karzinom wird nicht
entdeckt) berechnet man nach Formel (5.2) sofort: 04,096,01
=
=
P. – Man kann
auch anders argumentieren: die Wahrscheinlichkeiten, daß die Mammographie bzw. die
Palpation das Karzinom nicht entdecken, betragen jeweils 0,1 bzw. 0,4. Mit dem
Multiplikationssatz für unabhängige Ereignisse (Formel 5.11, Seite 108) ergibt sich
04,04,01,0
=
=
P. – Der Vollständigkeit halber seien angegeben: die Wahrschein-
lichkeit, daß durch die Mammographie und die Palpation ein Karzinom entdeckt wird,
beträgt 54,06,09,0
=
. Die Wahrscheinlichkeit, daß nur die Mammographie, nicht aber
die Palpation hilfreich ist, beträgt dann: 36,054,09,0
=
. Die Wahrscheinlichkeit, daß
nur die Palpation, aber nicht die Mammographie zum Erfolg führt, ist 06,054,06,0
=
.
Die Summe dieser Wahrscheinlichkeiten 06,036,054,004,0
+
+
+
ergibt 1 – logisch,
denn genau eine der 4 Möglichkeiten muß in jedem Fall eintreten.
Aufgabe 5.7: Krankheiten und Wahrscheinlichkeit
Lösung: D(0,40)
Mit dem Additionssatz ergibt sich für die Wahrscheinlichkeit, daß ein Patient an einer
Krankheit leidet (Diabetes oder Herz oder beide): 45,005,03,02,0
=
+
. Hier ist je-
doch nach der Wahrscheinlichkeit gefragt, daß ein Patient entweder herzkrank oder
diabetes-krank ist. Die Möglichkeit, daß beide Krankheiten vorliegen, ist also ausge-
schlossen. Deshalb muß die Wahrscheinlichkeit der Schnittmenge subtrahiert werden –
so ergibt sich: 40,005,045,0
=
.
32 5 Grundlagen der Wahrscheinlichkeitsrechnung
Aufgabe 5.8: 10 Merkmale eines Patienten
Lösung: A
Auch hier ermittelt man am besten zuerst die Wahrscheinlichkeit für das komplemen-
täre Ereignis: die Wahrscheinlichkeit, daß alle 10 Parameter innerhalb des Normbe-
reichs liegen, beträgt (bei Unabhängigkeit) 10
95,0. Also ist die Wahrscheinlichkeit da-
für, daß ein Parameter außerhalb des Normbereichs liegt, nach Formel (5.2):
40,095,01 10 . Die Ausdrucksweise: ... ein Parameter liegt außerhalb...bedeutet,
daß mindestens einer außerhalb liegt; d. h. dies kann für einen, 2, 3 oder mehr Para-
meter gelten. – Diese Aufgabe mag nicht sehr praxisbezogen sein. Wenn von einem
Patienten 10 Werte erfaßt werden, ist kaum davon auszugehen, daß diese unabhängig
voneinander sind. Die Aufgabe zeigt dennoch, daß man als behandelnder Arzt vor-
sichtig sein sollte etwa bei der Beurteilung von Laborwerten. Die Wahrscheinlichkeit,
daß einer von 10 Werten aus der Reihe fällt, ist recht hoch. Ein einzelner ausgefalle-
ner Wert sollte deshalb nicht überbewertet werden.
Aufgabe 5.9: Multiplikationssatz
Lösung: B(gilt nur bei unabhängigen Ereignissen)
Man mache sich die Bedeutung dieser Aussage klar: wenn A und B unabhängig sind,
beeinflußt das Ereignis B in keiner Weise die Wahrscheinlichkeit für das Eintreten von
A. Unabhängig sind beispielsweise Blutgruppe und Geschlecht. So beträgt die Wahr-
scheinlichkeit für Blutgruppe A 42%; egal, ob sie sich auf Frauen, auf Männer oder auf
die Gesamtbevölkerung bezieht. Siehe auch Seite 108 im Buch.
Aufgabe 5.10: Semmelweis – Berechnen einer Wahrscheinlichkeit
Lösung: E(etwa 19%)
Antwort A ist falsch – man kann die gefragte Wahrscheinlichkeit sehr wohl berechnen.
Offensichtlicher Unsinn ist auch Antwort B: eine Wahrscheinlichkeit kann nie über
100% liegen. Unter C ist die bedingte Wahrscheinlichkeit angegeben, daß eine er-
krankte Frau stirbt (die Letalität) mit 80,0)|(
=
KTP. Unter D findet man die Wahr-
scheinlichkeit, daß eine Frau erkrankt (die Inzidenz) mit 24,0)(
=
KP. Nach dem
Multiplikationssatz (5.9) berechnet man für die Wahrscheinlichkeit, zu erkranken und
zu sterben (die Mortalität) 19,024,080,0)()|()(
=
=
KPKTPKTP.
5 Grundlagen der Wahrscheinlichkeitsrechnung 33
Aufgabe 5.11: Karzinom am Versuchstier
Lösung: E(0,86)
Man wendet ganz einfach den Additionssatz für unabhängige Ereignisse an (Formel
(5.10), Seite 108) und erhält: 86,024,01,13,08,03,08,0
=
=
+
(sollte auch ohne
Taschenrechner zu bewältigen sein).
Aufgabe 5.12: Erwartungswert beim Würfeln
Lösung: D(3,5)
Der Erwartungswert bei jeder der Zufallsvariablen X und Y ist 3,5; gesucht ist der Er-
wartungswert der Variablen
X
2
. Nach Gleichungen (5.23) und (5.24) gilt:
5,35,37)()(2)2(
=
=
=
YEXEYXE . Siehe auch Beispiel 5.11 auf Seite 116.
Aufgabe 5.13: Transformation einer Zufallsvariablen
Lösung: A
Der Erwartungswert ändert sich analog zur Zufallsvariablen (also ba
+
µ
). Wegen der
quadratischen Dimension der Varianz wird diese mit dem Faktor 2
a multipliziert; die
Konstante b beeinflußt die Varianz nicht. Siehe Formeln (5.23) und (5.29), Seite 116 ff.
Noch eine kleine Anmerkung: bei der Formel (5.30) auf Seite 118 muß es heißen:
0)(Var
=
b. Bitte verbessern Sie das in Ihrem Buch. Pardon für diesen Tippfehler.
Aufgabe 5.14: Empirisches Ermitteln einer Wahrscheinlichkeit
Lösung: C(Gesetz der großen Zahl)
Diese Aufgabe wird gestellt, weil oft irgendwelche Namen genannt werden, ohne zu
wissen, was eigentlich dahinter steckt. Das Gesetz der großen Zahl rechtfertigt, daß
eine Wahrscheinlichkeit über eine relative Häufigkeit und ein Erwartungswert durch
einen Stichproben-Mittelwert geschätzt wird. Dies ist in einer empirischen Wissenschaft
wie der Medizin ein gängiges Verfahren. Die Axiome von Kolmogoroff und die
Definition von Laplace definieren Wahrscheinlichkeiten; die Ungleichung von Tsche-
byscheff ermöglicht Abschätzungen, wie weit die Meßwerte vom Erwartungswert ent-
fernt liegen (siehe Seite 120).
34 6 Spezielle Wahrscheinlichkeiten in der Medizin
6 Spezielle Wahrscheinlichkeiten in der Medizin
Aufgabe 6.1: Epidemiologische Maßzahlen
Eine Population wird ein Jahr lang beobachtet. Sei K das Ereignis, innerhalb dieser Zeit
an einer bestimmten Krankheit zu erkranken und T das Ereignis, daran zu sterben.
Ordnen Sie die Wahrscheinlichkeiten den entsprechenden Begriffen zu:
1. )(KPa. krankheitsspezifische Mortalität
2. )( KTP
b. Letalität
3. )|(KTPc. Inzidenz
d. Prävalenz
A. 1a, 2b, 3c
B. 1c, 2b, 3a
C. 1c, 2a, 3b
D. 1d, 2a, 3b
E. 1d, 2a, 3c
Aufgabe 6.2: Berechnen einer Mortalität
In einer Intensivstation erkranken 20% der Patienten an einer Lungenentzündung, die
Letalität bei dieser Krankheit betrage 70%. Wie hoch ist dann die krankheitsspezifische
Mortalität?
A. 90%
B. 45%
C. 3,5%
D. 14%
E. Die Mortalität kann aus den Angaben nicht berechnet werden.
Aufgabe 6.3: Risiken bei Mammakoarzinom
Von allen Frauen, die nicht familiär vorbelastet sind, erkrankt ungefähr jede 10. im
Laufe ihres Lebens an einem Mammakarzinom. Falls eine nahe weibliche Verwandte
bereits an einem Mammakarzinom erkrankt war oder ist, steigt der Wert für die Wahr-
scheinlichkeit, zu erkranken, auf das 3,5fache. Wie hoch ist dann das zuschreibbare
Risiko für den Faktor familiär belastet?
A. das zuschreibbare Risiko ist nicht berechenbar
B. 3,5
C. 0,10
D. 0,35
E. 0,25
6 Spezielle Wahrscheinlichkeiten in der Medizin 35
Aufgabe 6.4: Diagnostischer Test in der Notfallmedizin
Was ist bei einem diagnostischen Test, der in der Notfallmedizin bei lebensbedrohlichen
Erkankungen mit guter therapeutischer Beeinflußbarkeit angewandt wird, vor allem
anzustreben?
A. eine hohe Spezifität
B. eine hohe Sensitivität
C. eine niedrige Spezifität
D. eine niedrige Sensitivität
E. Spezifität und Sensitivität sollten gleich groß sein
Aufgabe 6.5: Diagnostischer Test – falsche Ergebnisse
Ein diagnostischer Test habe eine Sensitivität von 95%; die Prävalenz betrage 0,1%.
Was folgt aus diesen Angaben?
A. Die Wahrscheinlichkeit für ein falsch positives Testergebnis beträgt 5%.
B. Die Wahrscheinlichkeit für ein falsch negatives Testergebnis beträgt 5%.
C. Der positive Vorhersagewert beträgt 5%.
D. Die Spezifität beträgt mindestens 95%.
E. Keine dieser Aussagen ist herleitbar.
Aufgabe 6.6: Diagnostischer Test – positiver Vorhersagewert
Die Prävalenz einer Krankheit sei 0,0001. Ein diagnostischer Test habe eine Spezifität
von 0,995 und eine Sensititvität von 0,98. Wie groß ist etwa der positive Vorhersage-
wert?
A. 0,02
B. 0,98
C. 0,50
D. 0,999
E. Der positive Vorhersagewert läßt sich aus den Angaben nicht ermitteln.
Aufgabe 6.7: Diagnostischer Test – Ändern des Schwellenwerts
Bei vielen Tests ist das Ergebnis auch abhängig von einem Schwellenwert. Wie ändern
sich die Sensitivität und die Spezifität, wenn der Schwellenwert herabgesetzt wird?
A. Die Sensitivität und die Spezifität bleiben unverändert.
B. Die Sensitivität sinkt, die Spezifität steigt.
C. Die Spezifität sinkt, die Sensitivität steigt.
D. Die Sensitivität und die Spezifität werden größer.
E. Die Sensitivität und die Spezifität werden kleiner.
36 6 Spezielle Wahrscheinlichkeiten in der Medizin
Aufgabe 6.8: Diagnostischer Test – Interpretation des Ergebnisses
Bei einem jungen Mann, der drogenabhängig ist, wird ein HIV-Test durchgeführt (die
Prävalenz bei Drogenabhängigen beträgt 10%). Die Sensitivität des Tests liegt bei 98%.
Das Testergebnis ist positiv. Wie ist dieses Ergebnis zu interpretieren?
A. Das Ergebnis belegt eindeutig, daß der Patient infiziert ist.
B. Das Ergebnis belegt eindeutig, daß der Patient nicht infiziert ist.
C. Mit 98%-iger Wahrscheinlichkeit ist der Patient infiziert.
D. Die Angabe, daß der Patient drogenabhängig ist, ist irrelevant für die Interpre-
tation des Ergebnisses.
E. Aufgrund des Testergebnisses ist eine HIV-Infektion nicht auszuschließen. Für
eine sichere Diagnose ist das Ergebnis jedoch unzureichend.
Aufgabe 6.9: Zusammenhang zwischen Sensitivität und Spezifität
Bei manchen Tests lassen sich die Sensitivität und die Spezifität beeinflussen. Welche
Argumente sprechen für eine hohe Sensitivität?
1. es handelt sich um eine Krankheit mit gravierenden Folgen für den Patienten
2. es gibt eine erfolgversprechende Therapie
3. diese Therapie hat unter Umständen schwere Nebenwirkungen
4. die Therapie ist sehr teuer
5. die Therapie stellt die Patienten vor enorme psychische Belastungen
6. falsch-positive Befunde können relativ einfach geklärt werden
A. alle Argumente sprechen für eine hohe Sensitivität
B. nur die Argumente, die die Therapie betreffen (2, 3, 4 und 5)
C. nur die Argumente, die die Belastungen der Patienten betreffen (1 und 5)
D. nur die Argumente 1, 2 und 6
E. keines dieser Argumente
Aufgabe 6.10:* Verteilungsfunktion bei Sterbetafeln
Stellen Sie sich eine Sterbetafel vor mit den Sterbeziffern der im Jahr 1900 geborenen
Personen. Sei x die Variable für die gelebten Jahre. Dann beschreibt die Verteilungs-
funktion F(x) die Wahrscheinlichkeit für einen im Jahr 1900 lebendgeborenen Men-
schen,
A. höchstens das Alter x zu erreichen
B. mindestens das Alter x zu erreichen
C. zwischen dem x. und dem (x+1). Geburtstag zu sterben
D. den x. Geburtstag zu erleben
E. am x. Geburtstag bereits tot zu sein
6 Spezielle Wahrscheinlichkeiten in der Medizin 37
Aufgabe 6.1: Epidemiologische Maßzahlen
Lösung: C
Dazu muß man nur die Definitionen der Begriffe kennen (siehe Buch Seite 125f.)
Aufgabe 6.2: Berechnen einer Mortalität
Lösung: D(14 %)
Nach Formel (6.1) berechnet sich die Mortalität als das Produkt aus Inzidenz und Le-
talität – dies ergibt 14,07,02,0
=
.
Aufgabe 6.3: Risiken bei Mammakarzinom
Lösung: E(zuschreibbares Risiko 0,25)
Das Erkrankungsrisiko ohne den familiären Risikofaktor beträgt 1,0)|( =RKP , bei
familiärer Belastung ist es 3,5mal so hoch, also 35,0)|(
=
RKP. Dann beträgt nach
(6.3) das zuschreibbare Risiko 25,01,035,0)|()|( ==RKPRKP . D. h. der Anteil
0,25 ist der familiären Belastung zuzuschreiben, der Anteil 0,1 geht auf andere Ur-
sachen zurück. Das relative Risiko ist nach (6.2) gleich 3,5.
Aufgabe 6.4: Diagnostischer Test in der Notfallmedizin
Lösung: B(hohe Sensitivität)
Dies ist ein extremes Beispiel, das aber die Bedeutung einer hohen Sensitivität verdeut-
licht. Wenn es um eine lebensbedrohliche Krankheit (und dazu mit einer guten Thera-
pie) geht, sollte ein Test fast alle kranken Personen erkennen. Der damit verbundene
Nachteil ist, daß einige nicht-erkrankte Personen fälschlicherweise ein positives Tester-
gebnis erhalten und evtl. unnötigerweise therapiert werden. Dies ist aber zu rechtferti-
gen, wenn dadurch anderen Menschen möglicherweise das Leben gerettet wird.
Aufgabe 6.5: Diagnostischer Test – falsche Ergebnisse
Lösung: B(die Wahrscheinlichkeit für falsch negativ ist 5%)
Sensitivität ist die Wahrscheinlichkeit, daß der Test richtig positiv erkennt. Das dazu
komplementäre Ereignis ist falsch negativ. Die Wahrscheinlichkeit berechnet sich dann
als 05,095,01
=
. Analog ergänzen sich Spezifität (richtig negativ) und die Wahr-
scheinlichkeit für falsch positiv. Da die Spezifität hier aber nicht angegeben ist, lassen
sich weder die Wahrscheinlichkeit für falsch positiv (Antwort A) noch der positive
Vorhersagewert (Antwort C) bestimmen.
38 6 Spezielle Wahrscheinlichkeiten in der Medizin
Aufgabe 6.6: Diagnostischer Test – positiver Vorhersagewert
Lösung: A(0,02)
Es geht hier keineswegs darum, mit der Formel von Bayes nach (6.14) den Vorhersa-
gewert zu berechnen. Ein Kandidat sollte aber wissen, daß bei einer geringen Prävalenz
der positive Vorhersagewert sehr niedrig ist. Siehe Bsp. 6.5, Seite 135.
Aufgabe 6.7: Diagnostischer Test – Ändern des Schwellenwerts
Lösung: C
Je kleiner der Schwellenwert ist, um so mehr positive Testergebnisse wird man erhal-
ten. Das bedeutet einerseits, daß mehr kranke Personen richtig positiv eingestuft wer-
den (dadurch steigt die Sensitivität), aber andererseits, daß mehr gesunde Personen
falsch-positiv erkannt werden. Ein höherer Anteil falsch-positiver Ergebnisse geht ein-
her mit einer niedrigeren Spezifität (siehe auch Aufgabe 6.5).
Aufgabe 6.8: Diagnostischer Test – Interpretation des Ergebnisses
Lösung: E
Es ist klar, daß die Antworten A und B falsch sind. Ein positives Testergebnis allein
kann niemals eindeutig belegen, daß die Krankheit vorliegt (und schon gar nicht, daß
sie ausgeschlossen werden kann). Viele praktisch tätige Ärzte entscheiden intuitiv nach
Aussage C, indem sich die Sensitivität mit dem positiven Vorhersagewert gleichsetzen.
Das ist aber grundlegend falsch. Falsch ist auch der Inhalt von Antwort D. Die
Tatsache, daß der Patient drogenabhängig ist, bedeutet eine höhere Prävalenz und da-
mit auch einen höheren positiven Vorhersagewert. Richtig ist die vorsichtige Interpre-
tation des Testergebnisses (unter Berücksichtigung aller bekannten Faktoren) gemäß
Antwort E.
Aufgabe 6.9: Zusammenhang zwischen Sensitivität und Spezifität
Lösung: D(1, 2 und 6)
Hohe Sensitivität bedeutet: möglichst viele Kranke werden richtig positiv erkannt (da-
für sprechen eindeutig die Argumente 1 und 2), falsch-negative Ergebnisse werden
dabei weitgehend vermieden. Nach Argument 6 ist ein falsch-positiver Befund weit
weniger tragisch als ein falsch-negativer – auch dies spricht für eine hohe Sensitivität. –
Dagegen sprechen die Argumente 3-5 eher dafür, daß unnötige Therapiemaßnahmen
vermieden werden (also für wenig falsch-positive Ergebnisse und damit für eine hohe
Spezifität).
6 Spezielle Wahrscheinlichkeiten in der Medizin 39
Aufgabe 6.10:* Verteilungsfunktion bei Sterbetafeln
Lösung: A(höchstens das Alter x)
Diese Funktion ist – wie jede andere Verteilungsfunktion – monoton wachsend und
beschreibt Summenhäufigkeiten (bzw. aufaddierte Wahrscheinlichkeiten). Höchstens
das Alter x erreichen heißt: man stirbt vor dem x. Geburtstag. Deshalb ist 0)0(
=
F
(niemand, der lebend geboren wird, stirbt vor seinem 0. Geburtstag), steigt dann lang-
sam an und erreicht den Wert 1 etwa bei 120
=
x. Es ist ganz sicher (Wahrscheinlich-
keit 1), daß man höchstens 120 Jahre alt (oder noch älter wird).
40 7 Einige theoretische Verteilungen
7 Einige theoretische Verteilungen
Aufgabe 7.1: Binomialverteilung – Therapie
Eine Therapie ist mit der Wahrscheinlichkeit 9,0
=
p erfolgreich. Dann ist die Wahr-
scheinlichkeit, daß von 10 Behandlungen mindestens 8 erfolgreich verlaufen, gleich
A.
=
10
8
10 93,01,09,0
10
k
kk
k
B. 19,01,09,0
8
10 28
C. 81,01,09,0
8
10
128
D. 72,01,09,08
=
E. keine der Antworten A-D ist korrekt
Aufgabe 7.2: Binomialkoeffizient
Welcher der folgenden Ausdrücke quantifiziert die Anzahl der Möglichkeiten, aus 49
Lottokugeln 6 verschiedene auszuwählen?
A. 6
49
B. 444546474849
C.
!
43
!49
D. !6!43
!49
6
49
=
E.
!
6
496
Aufgabe 7.3: Binomialverteilung – Erbleiden
Beide Partner eines Elternpaares haben die Anlage für ein rezessives Erbleiden im he-
terozygoten Zustand. Sie haben n Kinder; X sei die Anzahl der Kinder mit heterozygo-
ten Erbanlagen. Welche Aussage trifft nicht zu?
A. X folgt einer Binomialverteilung.
B. Der Erwartungswert von X beträgt 2/n.
C. Die Varianz von X beträgt 4/n.
D. Die Verteilung von X ist symmetrisch.
E. X hat denselben Erwartungswert wie die Zufallsvariable, die die Anzahl der
homozygot erkrankten Kinder beschreibt.
7 Einige theoretische Verteilungen 41
Aufgabe 7.4: Poissonverteilung – Kinder mit Down–Syndrom
Die Anzahl der am Klinikum Mannheim geborenen Kinder beträgt etwa 2000
=
n pro
Jahr. Die Wahrscheinlichkeit, daß ein Neugeborenes mit einem Down-Syndrom zur
Welt kommt, betrage 1000/1
=
p. Wir nehmen an, daß die Ereignisse unabhängig
voneinander sind. Die Anzahl der Kinder mit Down-Syndrom sei X. Welche Aussage
trifft nicht zu?
A. X kann durch eine Poissonverteilung approximiert werden.
B. Der Erwartungswert von X beträgt 2.
C. Die Standardabweichung von X beträgt 2.
D. Die Varianz von X beträgt 2.
E. X ist eine diskrete Zufallsvariable, die theoretisch alle Werte zwischen 0 und
2000 annehmen kann.
Aufgabe 7.5:* Poissonverteilung – Geburtstag
Wie groß ist die Wahrscheinlichkeit, daß in einer Übungsgruppe mit 30 Studenten am
Tag der Klausur ein Student Geburtstag hat?
A. 0757,0
365
30 365/30
e
B. 0789,01 365/30
e
C. 0822,0
365
30
D. 0027,0
365
364
1
E. Keine der Antworten A-D ist korrekt.
Aufgabe 7.6 Verteilung von Wochentagen
Wir nehmen an, daß der Wochentag keinen Einfluß auf das Eintreten einer Spontange-
burt hat. Dann folgt die Verteilung der Geburtszeiten auf die Wochentage
A. einer Poissonverteilung
B. einer diskreten Gleichverteilung
C. einer Binomialverteilung
D. einer Normalverteilung
E. einer Polynomialverteilung
42 7 Einige theoretische Verteilungen
Aufgabe 7.7 Spezielle Normalverteilungen
Welche der folgenden Merkmale bzw. Zufallsvariablen können als normalverteilt an-
gesehen werden?
1. die Körpergröße erwachsener Frauen
2. die Körpergröße der gesamten erwachsenen Bevölkerung
3. das Körpergewicht erwachsener Frauen
4. Meßfehler
5. Lebensdauern
6. die Mittelwerte, die aus zahlreichen Stichproben des Umfangs 30
=
n aus einer
bestimmten Grundgesamtheit berechnet werden
7. eine binomialverteilte Zufallsvariable )2,0;100(:BX
A. nur 1, 4, 6 und 7
B. nur 6 und 7
C. nur 1–5
D. keines
E. alle
Aufgabe 7.8 Normalverteilung – allgemeine Eigenschaften
Welche Aussage ist richtig?
A. Bei einer Normalverteilung liegen alle Werte zwischen
σ
µ
3 und
σ
+
µ
3.
B. Je größer die Varianz, desto flacher verläuft die Glockenkurve.
C. In der Regel stimmen der Erwartungswert und der Median nicht überein.
D. Der Erwartungswert ist immer gleich 0.
E. Der Erwartungswert kann keine negativen Werte annehmen.
Aufgabe 7.9 Normalverteilung – Dichtefunktion
Welche Aussage ist falsch?
A. Die spezielle Form der Glockenkurve ist unabhängig von der Varianz 2
σ.
B. Die Dichtefunktion wird durch eine Glockenkurve graphisch dargestellt.
C. Die Dichtefunktion ist symmetrisch bzgl. des Erwartungswerts
µ
.
D. Das Integral unter der gesamten Kurve hat den Wert 1.
E. Die Dichtefunktion hat für alle x-Werte zwischen
und
+
einen Funkti-
onswert, der größer als 0 ist.
7 Einige theoretische Verteilungen 43
Aufgabe 7.10 Standardnormalverteilung
Sei ),(: 2
σµNX und Z standardnormalverteilt. Welche Aussagen sind richtig?
1. )1,0(:NZ
2. )0,1(:NZ
3. Durch 2
/)( σµX wird X in Z transformiert.
4. Eine Rücktransformation von Z in X ist nicht immer möglich.
A. Nur 1 und 3 sind richtig.
B. Nur 2 und 3 sind richtig.
C. Nur 1, 3 und 4 ist richtig.
D. Nur 2, 3 und 4 ist richtig.
E. Nur 1 ist richtig.
Aufgabe 7.11: Normalverteilung – Transformationen von X
Sei ),(: 2
σµNX normalverteilt. Welche der folgenden Aussagen ist falsch?
A.
a
X
=
ist normalverteilt mit ),(: 2
σµaNY
B.
σ
µ
=
/)(XY ist standardnormalverteilt.
C.
σ
=
/XY ist normalverteilt mit )1,/(:
σ
µ
NY
D. 2
X
=
ist normalverteilt mit ),(: 42 σµNY
E. baXY
+
=
ist normalverteilt mit ),(: 22σ+µabaNY
Aufgabe 7.12: Normalverteilung – Referenzbereiche
Die Körpergröße männlicher Studenten sei normalverteilt mit einem Erwartungswert
von 180
=
µ
cm und einer Standardabweichung von 6
=
σ
cm. Wieviel Prozent der
Studenten sind dann größer als 186 cm oder kleiner als 168 cm?
A. etwa 32 %
B. etwa 5 %
C. etwa 18,5 %
D. etwa 34,5 %
E. etwa 95 %
44 7 Einige theoretische Verteilungen
Aufgabe 7.13: Symmetrische Verteilungen
Welche der folgenden Verteilungen sind symmetrisch?
1. Standardnormalverteilung
2. Normalverteilung allgemein
3. Binomialverteilung ),(pnBmit 5,0
=
p
4. Poissonverteilung )(
λ
P
5. diskrete Gleichverteilung
6. Verteilung zur Beschreibung von Lebensdauern von Personen
7. t-Verteilung
8. Chi2-Verteilung
A. nur 1 ist symmetrisch
B. nur 1 und 2 sind symmetrisch
C. nur 1, 2, 3, 5 und 7 sind symmetrisch
D. alle außer 4 und 6 sind symmetrisch
E. alle außer 6 sind symmetrisch
Aufgabe 7.14: Verteilung von Mittelwerten
Der systolische Blutdruck bei gesunden Männern zwischen 20 und 30 Jahren ist sym-
metrisch verteilt mit 120
=
µ
mmHg und 10
=
σ
mmHg. Wie sind dann die Mittelwerte
verteilt, die aus den Blutdruckwerten von 25 zufällig ausgewählten Studenten berechnet
werden?
A. genauso verteilt wie die Blutdruckwerte der Studenten
B. normalverteilt mit 120
=
µ
mmHg und unbekannter Varianz
C. normalverteilt mit 120
=
µ
mmHg und 4,0=σxmmHg
D. normalverteilt mit 120
=
µ
mmHg und 2=σxmmHg
E. Über die Verteilung der Mittelwerte kann nichts ausgesagt werden.
7 Einige theoretische Verteilungen 45
Aufgabe 7.1: Binomialverteilung – Therapie
Lösung: A
„Mindestens 8 sind erfolgreichheißt, daß 8, 9 oder 10 Behandlungen erfolgreich sind.
Dies läßt sich ausrechnen über die Wahrscheinlichkeitsfunktion der Binomialverteilung,
Formel (7.6) auf Seite 145. Mit 10
=
n, 9,0
=
p und 1,0
=
q erhält man:
19,0)8(
=
=
XP, 39,0)9(
=
=
XP und 35,0)10(
=
=
XP – die Summe ergibt 93%.
Die Angabe in Antwort B quantifiziert die Wahrscheinlichkeit, daß genau 8 Therapien
erfolgreich sind.
Aufgabe 7.2: Binomialkoeffizient
Lösung: D
Der Binomialkoeffizient quantifiziert die Anzahl der Möglichkeiten, aus einer 49-ele-
mentigen Menge 6 Objekte auszuwählen. Genau danach ist gefragt. Dieser Ausdruck
entspricht ungefähr 14 Millionen – dementsprechend gering sind die Aussichten auf
einen 6er im Lotto. – Es ist wichtig, sich folgendes klarzumachen: die Kugeln werden
nacheinander gezogen und nicht wieder zurückgelegt; die Reihenfolge der gezogenen
Kugeln spielt keine Rolle. Unter A ist die Anzahl der Möglichkeiten angegeben, 6
Elemente aus 49 zu ziehen, wenn jede Kugel nach dem Zug wieder zurückgelegt wird
und die Reihenfolge der Ziehungen wichtig ist. Der Ausdruck in B (der gleichbedeutend
zu dem in C ist) gibt an, wie viele Möglichkeiten es gibt, 6 aus 49 zu ziehen, wenn die
Kugeln nicht zurückgelegt werden und die Reihenfolge der Ziehungen eine Rolle spielt.
Da die Reihenfolge bei den Lottokugeln unerheblich ist, wird nochmal durch 6!
dividiert und man erhält den Binomialkoeffizienten unter D.
Aufgabe 7.3: Binomialverteilung – Erbleiden
Lösung: E(trifft nicht zu)
Jedes Kind erhält mit der Wahrscheinlichkeit 2/1
=
p heterozygote Erbanlagen. Die
Anzahl X läßt sich dann durch eine Binomialverteilung beschreiben; nach (7.3) und
(7.4) berechnet man den Erwartungswert 2/n und die Varianz 4/n. Für 2/1
=
p ist
die Verteilung symmetrisch (siehe Abbildung 7.2 Seite 150). Also sind die Antworten
A–D korrekt. Falsch ist E. Die Wahrscheinlichkeit, daß ein Kind homozygot erkrankt
(oder auch homozygot gesund) ist, beträgt 1/4; der Erwartungswert ist dann 4/n.
Aufgabe 7.4: Poissonverteilung – Kinder mit Down-Syndrom
Lösung: C(Standardabweichung ist nicht 2)
Es ist hoffentlich einsichtig, daß man die Anzahl der Kinder mit Down-Syndrom durch
eine Binomialverteilung beschreiben kann. Weil hier n sehr groß und p sehr klein ist,
46 7 Einige theoretische Verteilungen
läßt sich die Binomialverteilung durch eine Poissonverteilung approximieren (bei der
Erwartungswert und Varianz übereinstimmen). Für dieses Beispiel haben sie den Wert:
21000/2000
=
=
=
λ
np . Also sind A, B und D richtig, C ist falsch (die Standardab-
weichung beträgt 2). Richtig ist auch E: X kann theoretisch alle Werte zwischen 0
und 2000 annehmen, auch wenn damit zu rechnen ist, daß X in der Praxis nicht größer
als 6 wird (siehe auch Beispiel 7.6 auf Seite 151).
Aufgabe 7.5:* Poissonverteilung – Geburtstag
Lösung: B
Ein Student hat Geburtstag, bedeutet: mindestens einer. Also löst man diese Aufgabe
am besten dadurch, daß man zunächst die Wahrscheinlichkeit für das komplementäre
Ereignis (keiner hat Geburtstag) berechnet. Diese ergibt sich mit Formel (7.14) und
0
=
k als 365/30
e (auch hier läßt sich die Binomialverteilung durch eine Poissonvertei-
lung mit 365/30
=
λ
approximieren). Die Antwort A gibt die Wahrscheinlichkeit an,
daß genau ein Student an diesem Tag Geburtstag hat.
Aufgabe 7.6: Verteilung von Wochentagen
Lösung: B
Es gibt hier 7 Ausprägungen (nämlich die Wochentage Montag bis Sonntag) mit jeweils
der Wahrscheinlichkeit 1/7. Dies ist eine diskrete Gleichverteilung.
Aufgabe 7.7: Spezielle Normalverteilungen
Lösung: A(Körpergröße, Meßfehler, Mittelwerte und )2,0;100(:BX )
Die Körpergröße erwachsener Frauen ist ein Merkmal, das – im Gegensatz zum Kör-
pergewicht – kaum beeinflußbar ist. Beim Körpergewicht gibt es insbesondere im obe-
ren Bereich Ausreißer; dieses Merkmal ist (ebenso wie Lebensdauern) rechtsschief
verteilt. Wenn man die Größe aller Erwachsenen (heterogene Population) betrachtet,
wird man eine 2-gipfelige Verteilung erhalten mit einem „weiblichenund einem
„männlichen“ Gipfel – also keine Normalverteilung. Meßfehler sind ein klassisches
Beispiel für eine Normalverteilung – das wußte schon Carl Friedrich Gauss. Nach dem
zentralen Grenzwertsatz sind auch Mittelwerte normalverteilt, ebenso Binomialvertei-
lungen, falls 9)1(
>
ppn (in unserem Beispiel ist 16)1(
=
ppn ).
7 Einige theoretische Verteilungen 47
Aufgabe 7.8: Normalverteilung – allgemeine Eigenschaften
Lösung: B(große Varianz, flache Kurve)
Innerhalb des 3σ-Bereichs liegen zwar 99,7% aller Werte, aber eben nicht alle (Antwort
A). Daß bei einer großen Varianz die Glockenkurve flach und bei einer kleinen Varianz
die Kurve hoch-gestreckt ist, erkennt man in Abbildung 7.4 auf Seite 160. Der
Erwartungswert und der Median sind – wie bei jeder symmetrischen Verteilung –
identisch (also C falsch). Der Erwartungswert kann beliebige Werte – auch negative –
annehmen, deshalb sind D und E falsch.
Aufgabe 7.9: Normalverteilung – Dichtefunktion
Lösung: A(Aussage ist falsch)
Die spezielle Form der Glockenkurve ist keineswegs unabhängig von der Varianz; je
größer die Varianz, desto flacher die Kurve (siehe Aufgabe 7.8). Alle anderen Aussa-
gen sind richtig; siehe Seite 156 ff.
Aufgabe 7.10: Standardnormalverteilung
Lösung: E(nur 1 ist richtig)
Die Standardnormalverteilung hat den Erwartungswert 0 und die Varianz 1 (Aussage
1), nicht umgekehrt (Aussage 2 ist deshalb falsch). Die Transformation ist
σ
µ
/)(X;
es wird also nicht durch σ2 dividiert (deshalb ist 3 falsch). Jede transformierte Variable
kann über
Z
X
σ
+
µ
=
zurücktransformiert werden; Aussage 4 ist also auch falsch.
Aufgabe 7.11: Normalverteilung – Transformationen von X
Lösung: D(2
X
ist nicht normalverteilt)
Alle linearen Transformationen (A, B, C und E) ändern nichts an der Tatsache der
Normalverteilung. Dabei ändern sich lediglich der Erwartungswert und die Varianz;
diese ergeben sich nach den Formeln (5.23) und (5.29). Bei nichtlinearen Transforma-
tionen wie z. B. 2
X
gehen die Eigenschaften der Normalverteilung verloren.
Aufgabe 7.12: Normalverteilung – Referenzbereiche
Lösung: C(etwa 18,5 %)
Der σ-Bereich ist in diesem Fall das Intervall [174,186], der 2σ-Bereich ist [168,192].
Innerhalb des σ-Bereichs liegen 68% aller Meßwerte, außerhalb 32%; d. h. größer als
die obere Grenze (also 186 cm) sind 16%. Außerhalb des 2σ-Bereichs liegen etwa 5%
48 7 Einige theoretische Verteilungen
aller Werte; d. h. kleiner als die untere Grenze (168 cm) sind 2,5%. 16% + 2,5% ergibt
18,5 % (siehe auch Tabelle 7.1 auf Seite 161).
Aufgabe 7.13: Symmetrische Verteilungen
Lösung: C(1, 2, 3, 5 und 7 sind symmetrisch)
Die Normalverteilung ist immer symmetrisch – nicht nur die Standardnormalverteilung
(siehe Abb. 7.4, Seite 160). Die Binomialverteilung ist nur für 5,0
=
p symmetrisch, die
Poissonverteilung ist generell rechtsschief (siehe Abb. 7.1 – 7.3, Seite 150). Auch die
Gleichverteilung (bei der jede Wahrscheinlichkeit gleich sind) ist symmetrisch.
Lebensdauer-Verteilungen sind dagegen rechtsschief (z. B. die Lognormal-Verteilung
oder die Exponential-Verteilung). Die t-Verteilung ähnelt der Normalverteilung und ist
wie diese symmetrisch im Gegensatz zur Chi2-Verteilung, die rechtsschief ist (siehe
Abb. 7.8, Seite 179).
Aufgabe 7.14: Verteilung von Mittelwerten
Lösung: D(120
=
µ
mmHg, 2=σx mmHg)
Nach dem zentralen Grenzwertsatz sind Mittelwerte normalverteilt mit dem Erwar-
tungswert µ und der Varianz n/
2
σ (siehe Seite 166). Demnach ist der Erwartungswert
120
=
µ
mmHg und die Standardabweichung n/σ, also 10 mmHg / 5 = 2 mmHg.
8 Schätzverfahren 49
Teil III: Induktive Statistik
8 Schätzverfahren
Aufgabe 8.1: Eigenschaften eines Schätzverfahrens
Welche Aussage ist falsch?
A. Der zu schätzende Parameter der Grundgesamtheit ist unbekannt.
B. Der zu schätzende Parameter der Grundgesamtheit ist eine konstante Größe.
C. Die Schätzfunktion ist eine Zufallsvariable, deren Realisation abhängig ist von
der Stichprobe.
D. Das Konfidenzintervall ist ein Bereich, das den zu schätzenden Parameter mit
Sicherheit enthält.
E. Um eine erwartungstreue Schätzung zu ermöglichen, muß eine repräsentative
Stichprobe vorliegen.
Aufgabe 8.2: Konfidenzintervall für den Erwartungswert
Welche der folgenden Aussagen bzgl. eines Konfidenzintervalls für µ ist richtig?
A. Je größer der Stichprobenumfang n ist, um so größer ist das Konfidenzintervall.
B. Je größer n ist, um so kleiner ist das Konfidenzintervall.
C. Die Breite des Konfidenzintervalls ist unabhängig von n.
D. Jedes Konfidenzintervall, das aus einer repräsentativen Stichprobe ermittelt
wird, enthält µ.
E. Der Stichprobenmittelwert ist unerheblich für die Bestimmung der Intervall-
grenzen.
Aufgabe 8.3: Standardfehler des Mittelwerts
Wie muß der Stichprobenumfang n geändert werden, um den Standardfehler des Mit-
telwerts zu halbieren?
A. n muß ebenfalls halbiert werden.
B. n muß verdoppelt werden.
C. n muß vervierfacht werden.
D. Dazu ist ein Stichprobenumfang von n2 erforderlich.
E. n muß nicht gerändert werden, da der Standardfehler des Mittelwerts unabhän-
gig von n ist.
50 8 Schätzverfahren
Aufgabe 8.4: Ermitteln eines Konfidenzintervalls mit der t-Verteilung
Mit Hilfe der t-Verteilung soll ein 2-seitiges Konfidenzintervall für den Erwartungswert
µ gebildet werden. Welcher Parameter wird dafür nicht benötigt?
A. der Stichproben-Mittelwert
x
B. die empirische Standardabweichung s
C. der Stichprobenumfang n
D. das Quantil 2/1;1αn
t der t-Verteilung
E. die Standardabweichung σ der Grundgesamtheit
Aufgabe 8.5: Breite eines Konfidenzintervalls
Wovon ist die Breite eines Konfidenzintervalls für µ nicht abhängig?
A. vom Stichprobenumfang n
B. vom Stichproben-Mittelwert
x
C. von der Irrtumswahrscheinlichkeit α
D. von der Variabilität der Meßwerte
E. davon, ob das Intervall 1-seitig oder 2-seitig ist
Aufgabe 8.6: Konfidenzintervall für die Körpergröße
Wir nehmen an, daß die Körpergröße X erwachsener Frauen normalverteilt ist mit der
Standardabweichung
cm
5
=
σ
. Aus einer Stichprobe von 25 Frauen ergibt sich ein
Mittelwert cm 168
=
x. Damit läßt sich als 2-seitiges Konfidenzintervall zur Irrtums-
wahrscheinlichkeit 05,0
=
α
ermitteln:
A.
[
]
cm 173 ; cm 163
B.
[
]
cm 178 ; cm 158
C.
[
[
; cm 164
D.
[
]
cm 170 ; cm 166
E. Dieses Intervall kann nicht bestimmt werden, da die empirische Standardab-
weichung nicht angegeben ist.
Aufgabe 8.7:* Schätzeigenschaften von Mittelwert und Median
Der Erwartungswert einer Grundgesamtheit soll geschätzt werden. Welche Aussage
trifft zu?
A. Bei schief-verteilten Merkmalen ist die Schätzung über den empirischen Median
nicht erwartungstreu.
B. Bei symmetrisch verteilten Merkmalen ist die Schätzung durch den Median
zwar erwartungstreu, aber nicht konsistent.
8 Schätzverfahren 51
C. Bei normalverteilten Merkmalen ergeben der Mittelwert und der Median einer
Stichprobe stets denselben Schätzwert.
D. Der Median liefert stets einen Schätzwert, dessen Abstand zum Erwartungswert
größer ist als der Abstand zwischen Mittelwert und Erwartungswert.
E. Der Median ist ebenso wie der Mittelwert erschöpfend.
Aufgabe 8.8:* Schätzen von Varianz und Standardabweichung
Welche Aussage ist falsch?
A. Bei der Berechnung der empirischen Varianz wird durch 1
n dividiert, damit
die Schätzung erwartungstreu ist.
B. Die Schätzung der Standardabweichung durch die Wurzel aus der empirischen
Varianz ist nicht erwartungstreu.
C. Bei der Berechnung der empirischen Varianz wird durch 1
n dividiert, damit
die Schätzung konsistent ist.
D. Die Schätzung der Standardabweichung durch die Wurzel aus der empirischen
Varianz ist konsistent.
E. Je größer der Stichprobenumfang n ist, desto genauer ist die Schätzung der Va-
rianz.
Aufgabe 8.9: Interpretation eines Konfidenzintervalls
In Beispiel 8.4 (Seite 196) erhält man für den Anteil weiblicher Medizinstudenten aus
einer Stichprobe einen Schätzwert von 435,0
ˆ
=
p und als 95%-Konfidenzintervall
[
]
559,0;311,0. Was besagt dieses Intervall bezüglich des Anteils weiblicher Medizin-
studenten in der Grundgesamtheit?
A. Dieser Anteil liegt mit Sicherheit zwischen den Werten 0,311 und 0,559.
B. Der Anteil liegt mit 95%-iger Wahrscheinlichkeit zwischen 0,311 und 0,559.
C. Der „weibliche“ Anteil ist mit einer Wahrscheinlichkeit von 2,5% geringer als
0,311.
D. Dieser Anteil ist mit einer Wahrscheinlichkeit von 2,5% größer als 0,559.
E. Es ist letzten Endes unbekannt, ob der zu schätzende Anteil innerhalb des Kon-
fidenzintervalls liegt. Man weiß nur, daß das angewandte Verfahren – sofern
seine Voraussetzungen erfüllt sind – mit 95%-iger Wahrscheinlichkeit ein Kon-
fidenzintervall erzeugt, das den Anteil der Grundgesamtheit enthält.
52 8 Schätzverfahren
Aufgabe 8.10:* Zensierte Daten
Bei Überlebensstudien treten oft zensierte Beobachtungen auf. Diese können mit einem
Verfahren nach Kaplan und Meier ausgewertet werden. Welche Aussage ist richtig?
A. Die Gründe, die eine Zensur notwendig machen, sollten in keinem Zusammen-
hang zu den Endereignissen stehen.
B. Zensierte Beobachtungen haben keinerlei Einfluß auf das Ergebnis der Studie.
C. Bei der Kaplan-Meier-Methode werden zensierte Daten vollständig eliminiert.
D. Zensierte Beobachtungen sind vollkommen unproblematisch, solange der
Stichprobenumfang genügend groß bleibt.
E. Bei den Schätzungen nach der Kaplan-Meier-Methode werden zu jedem Beob-
achtungszeitpunkt gleich viele Beobachtungseinheiten berücksichtigt.
8 Schätzverfahren 53
Aufgabe 8.1: Eigenschaften eines Schätzverfahrens
Lösung: D(diese Aussage ist falsch!)
Man erhält (bei einer Irrtumswahrscheinlichkeit von 5%) nur mit 95%-iger Wahr-
scheinlichkeit aus der Stichprobe ein Konfidenzintervall, das den zu schätzenden Para-
meter enthält. Alle anderen Aussagen sind korrekt: der Parameter ist eine unbekannte,
konstante Größe (A und B); die Schätzfunktion liefert mit jeder Stichprobe einen ande-
ren Schätzwert (C). Logischerweise muß die Stichprobe repräsentativ sein (E); anson-
sten begeht man einen systematischen Fehler und die Schätzung ist nicht erwartungs-
treu.
Aufgabe 8.2: Konfidenzintervall für den Erwartungswert
Lösung: B(je größer n, desto kleiner das Intervall)
Es ist klar: ein großes n ermöglicht eine präzisere Schätzung. Dies bedeutet: ein kleines
Konfidenzintervall. Dies Abhängigkeit kommt auch in den Formeln (8.8) oder (8.9)
zum Ausdruck. Daher ist B richtig, A und C sind falsch. Daß die Aussage D nicht
stimmt, wurde oben bei Aufgabe 8.1 erläutert. Auch E ist Unsinn: basierend auf dem
Mittelwert werden die Intervallgrenzen berechnet.
Aufgabe 8.3: Standardfehler des Mittelwerts
Lösung: C(n muß vervierfacht werden)
Der Standardfehler des Mittelwerts ist n/σ (siehe Seite 195 oben). Dieser Fehler
wird halbiert, indem man den Nenner verdoppelt. Weil der Stichprobenumfang unter
einer Wurzel steht, ist 4n (statt n) erforderlich.
Aufgabe 8.4: Ermitteln eines Konfidenzintervalls mit der t-Verteilung
Lösung: E(σ ist nicht notwendig)
Ein Blick auf die Formel zur Bestimmung des Konfidenzintervalls (8.10) auf Seite 194
zeigt, daß alle Parameter, die unter A–D genannt werden, zur Bestimmung des Konfi-
denzintervalls notwendig sind. Den Parameter σ der Grundgesamtheit (der ja meist
unbekannt ist), geht in diese Berechnung nicht ein. Er wird durch die empirische Stan-
dardabweichung s geschätzt. Das ist der Vorteil der t-Verteilung !
Aufgabe 8.5: Breite eines Konfidenzintervalls
Lösung: B(Mittelwert)
54 8 Schätzverfahren
Der Mittelwert ist die Mitte des Konfidenzintervalls; er beeinflußt jedoch nicht dessen
Breite (siehe auch Formel (8.16)). Alle anderen Größen schon: je größer n und je grö-
ßer α, desto kleiner ist das Konfidenzintervall (A und B). Die Variabilität der Meß-
werte wirkt sich aus auf σ bzw. s ; je größer die Variabilität, desto größer das Intervall
(Antwort D). 1-seitige Intervalle haben sind unendlich breit; 2-seitige nicht (E).
Aufgabe 8.6: Konfidenzintervall für die Körpergröße
Lösung: D
[
]
cm 170 ; cm 166
Hier ist ausnahmsweise die Standardabweichung σ der Grundgesamtheit bekannt; daher
läßt sich das Konfidenzintervall nach (8.8) bestimmen. Der Ausdruck n/96,1 σ
ergibt ungefähr 2; demnach ergeben sich die Grenzen 166 cm und 170 cm. Bei der
Angabe unter C handelt es sich um ein 1-seitiges Intervall.
Aufgabe 8.7:* Schätzeigenschaften von Mittelwert und Median
Lösung: A(Median ist bei schiefen Verteilungen nicht erwartungstreu)
Bei schiefen Verteilungen stimmen Mittelwert und Median nicht überein; deshalb wäre
die Schätzung über den Median verzerrt. Nur bei symmetrischen Verteilungen ist diese
Schätzung erwartungstreu und auch konsistent (B ist also falsch). Offensichtlich
unsinnig ist Antwort C; es wäre ein großer Zufall, wenn Mittelwert und Median einer
Stichprobe übereinstimmten. Man kann auch nicht sagen, daß der geschätzte Median
stets weiter weg vom Erwartungswert liegt als der Mittelwert (D ist also auch falsch).
Er ist aber im Durchschnitt ein schlechterer Schätzer, da er weniger effizient ist als die
Schätzung über den Mittelwert (E ist also falsch).
Aufgabe 8.8:* Schätzen von Varianz und Standardabweichung
Lösung: C(diese Aussage ist falsch)
A und B sind richtig: die empirische Varianz ist ein erwartungstreuer Schätzer für die
Varianz der Grundgesamtheit; die Standardabweichung dagegen nicht (siehe Ausfüh-
rungen Seite 186). Allerdings wird nur wegen der Erwartungstreue, nicht wegen der
Konsistenz durch n–1 dividiert (konsistent wäre die Schätzung auch bei der Division
durch n).
Aufgabe 8.9: Interpretation eines Konfidenzintervalls
Lösung: E
Hierzu sei auf die Anmerkung auf Seite 192 im Buch verwiesen. Man kann niemals
sagen, daß ein Parameter „mit Sicherheitoder einer bestimmten Wahrscheinlichkeit
8 Schätzverfahren 55
innerhalb oder außerhalb des Konfidenzintervalls liegt. Dem Parameter haftet nämlich
nichts zufälliges an; zufällig sind dagegen die Stichprobe und auch das aus ihr berech-
nete Konfidenzintervall. Richtig ist deshalb nur die Aussage E.
Aufgabe 8.10:* Zensierte Daten
Lösung: A
Zensierte Daten sind problematisch, weil Information verloren geht und weil sie die
Ergebnisse einer Studie verzerren können (B und D sind also falsch). Wenn sie dennoch
auftreten, hat man darauf zu achten, daß die Gründe in keinem Zusammenhang mit den
kritischen Endereignissen stehen (also A). Die Kaplan-Meier-Methode wertet soviel
Information wie möglich aus (also ist C falsch). Leider reduziert sich der Stichpro-
benumfang mit wachsenden Zeitwerten (E falsch).
56 9 Statistische Tests
9 Statistische Tests
Aufgabe 9.1: Formulieren der Hypothesen
Ein Forscher hofft, daß ein von ihm entwickeltes Medikament zur Blutdrucksenkung
besser wirkt als ein herkömmliches Standardmedikament und will dies durch einen Test
absichern. Wie soll er seine Vermutung formulieren?
A. als Nullhypothese
B. als Alternativhypothese
C. dies ist gleichgültig
D. dies hängt von den Folgen einer Fehlentscheidung ab
E. dies hängt von ethisch-moralischen Überlegungen ab
Aufgabe 9.2: Grundlagen
Welche Aussage ist falsch?
A. Bei jedem Test schließen sich Annahme- und kritischer Bereich aus.
B. Die Größe des α-Fehlers beeinflußt die Größe des ß-Fehlers.
C. Ob 1- oder 2-seitig getestet wird, muß vor der Testdurchführung aufgrund
sachlogischer Überlegungen entschieden werden.
D. Die Meßwerte der Beobachtungseinheiten innerhalb einer Stichprobe müssen
unabhängig voneinander sein.
E. Der Stichprobenumfang hat keinerlei Einfluß auf das Testergebnis.
Aufgabe 9.3: Testentscheidungen
Welche Aussage ist richtig?
A. Liegt nach der Durchführung eines Tests die Testgröße nicht im Annahmebe-
reich, wird die Nullhypothese abgelehnt.
B. Die Größe des Fehlers 1. Art ist zufällig.
C. Wenn die Nullhypothese nicht abgelehnt wird, wird stets ein Fehler 2. Art ge-
macht.
D. Der Ablehnungsbereich ist immer ein zusammenhängendes Intervall.
E. Wenn die Alternativhypothese richtig ist, beträgt die Wahrscheinlichkeit, auf-
grund des Testergebnisses falsch zu entscheiden, höchstens α.
Aufgabe 9.4: α-Fehler
Beim Test einer Nullhypothese 0
H gegen eine Alternativhypothese 1
H bedeutet eine
Wahrscheinlichkeit 05,0
=
α
für den Fehler 1. Art: die Wahrscheinlichkeit ist höchstens
0,05 dafür, daß man
9 Statistische Tests 57
A. 1
H annimmt, wenn 1
H richtig ist
B. 0
H beibehält, wenn 0
H richtig ist
C. 0
H nicht ablehnt, wenn 1
H richtig ist
D. 0
H ablehnt, obwohl 0
H richtig ist
E. 1
H fälschlicherweise ablehnt
Aufgabe 9.5: Tests und Merkmale
Welcher Test setzt qualitative Merkmale voraus?
A. der t-Test für 2 verbundene Stichproben
B. der Wilcoxon-Rangsummentest
C. der F-Test
D. der Chi2-Homogenitätstest
E. keiner dieser Tests
Aufgabe 9.6: ß-Fehler – Allgemeines
Welche Aussage bzgl. des ß-Fehlers ist richtig?
A. Der ß-Fehler wird vor der Testdurchführung festgelegt und beträgt üblicher-
weise 5%.
B. Der ß-Fehler ist immer größer als der α-Fehler.
C. Der ß-Fehler kann durch den Stichprobenumfang beeinflußt werden.
D. Je größer die Power (Güte) eines Tests ist, um so größer ist auch der ß-Fehler.
E. Der α-Fehler und der ß-Fehler sind unabhängig voneinander.
Aufgabe 9.7: ß-Fehler beim t-Test
Gegeben seien 2 Grundgesamtheiten mit den Erwartungswerten 1
µ und 2
µ und der
selben Varianz 2
σ. Daraus werden 2 Stichproben gezogen und deren Mittelwerte mit
dem t-Test für unverbundene Stichproben überprüft. Dabei wird die Wahrscheinlichkeit
für den ß-Fehler größer, wenn alle Größen gleichbleiben, aber
A. der Stichprobenumfang größer wird
B. die Irrtumswahrscheinlichkeit α größer wird
C. der Betrag der Differenz 21 µµ größer wird
D. die Varianz 2
σ größer wird
E. die Varianz 2
σ kleiner wird
58 9 Statistische Tests
Aufgabe 9.8: Nicht-signifikantes Testergebnis
Ein Forscher hat ein schmerzstillendes Präparat entwickelt und überprüft dessen Wir-
kung über einen statistischen Test, wobei er das neue Präparat mit einem Placebo ver-
gleicht. Er erhält ein nicht-signifikantes Testergebnis (mit α=0,05). Wie ist dies zu in-
terpretieren?
A. Damit ist bewiesen, daß sich das neue Präparat von einem Placebo grundlegend
unterscheidet.
B. Damit ist bewiesen, daß das neu entwickelte Medikament wirkungslos ist.
C. Mit 95%-iger Wahrscheinlichkeit gibt es keinen Unterschied zwischen neuem
Präparat und Placebo.
D. Das Testergebnis besagt, daß weitergehende Forschungen auf diesem Gebiet
sinnlos sind.
E. Aufgrund des Ergebnisses läßt sich ein Unterschied zwischen dem neuem Prä-
parat und Placebo nicht nachweisen. Ein ß-Fehler ist dabei jedoch nicht ausge-
schlossen. Über dessen mögliche Ursachen muß nachgedacht werden.
Aufgabe 9.9: Voraussetzungen
Welche Tests setzen normalverteilte Daten voraus?
A. t-Tests
B. Wilcoxon-Rangsummentests
C. Chi2-Tests
D. alle diese Tests
E. keiner dieser Tests
Aufgabe 9.10: Auswahl eines Tests bei normalverteilten Daten
Gegeben seien 2 unverbundene Stichproben mit sehr günstigen Voraussetzungen: die
Daten entstammen aus 2 normalverteilten Grundgesamtheiten mit gleich großen Vari-
anzen. Es soll überprüft werden, ob man Gleichheit der Erwartungswerte annehmen
kann. Welchen Test sollte man bevorzugen?
A. den t-Test für 2 unverbundene Stichproben
B. den Welch-Test
C. den U-Test nach Mann, Whitney und Wilcoxon
D. Man wendet alle 3 Tests an und entscheidet sich dann für einen, der ein signifi-
kantes Ergebnis liefert.
E. Es ist vollkommen gleichgültig, welchen Test man anwendet, weil die Voraus-
setzungen für jeden Test erfüllt sind.
9 Statistische Tests 59
Aufgabe 9.11: Auswahl eines Tests bei schief-verteilten Daten
Man vergleicht das mittlere Körpergewicht einer Patientengruppe, die ein Jahr lang eine
bestimmte Diät zu sich genommen hat, mit dem mittleren Körpergewicht einer
vergleichbaren Gruppe, die sich mit Normalkost ernährt hat. Man weiß, daß die Ge-
wichte schief-verteilt sind und der Stichprobenumfang pro Gruppe nicht größer als 10
ist. Welcher Test eignet sich am ehesten?
A. der t-Test für verbundene Stichproben
B. der t-Test für unverbundene Stichproben
C. der U-Test nach Mann, Whitney und Wilcoxon
D. der Welch-Test
E. der Vorzeichentest
Aufgabe 9.12: t-Test für 2 unverbundene Stichproben
Zu einem t-Lagetest werden 2 unverbundene Stichproben der Umfänge 1
n und 2
n her-
angezogen. Welche Aussage ist falsch?
A. Dieser Test setzt gleiche Varianzen der Grundgesamtheiten voraus.
B. Die Umfänge müssen gleich groß sein.
C. Dieser Test setzt normalverteilte Grundgesamtheiten voraus.
D. Die Anzahl der Freiheitsgrade beträgt 2
21 +=nnf.
E. Man legt beim Testen die Nullhypothese 21 µ=µ zugrunde.
Aufgabe 9.13: Chi2-Test
Bei einem Chi2-Test ergibt sich für den Wert der Prüfgröße 0
2=χ. Was besagt dieses
Ergebnis?
A. Dieses Ergebnis ist unmöglich, da die Prüfgröße nur positive Werte annehmen
kann.
B. Aufgrund des Testergebnisses behält man die Nullhypothese bei; ein ß-Fehler ist
bei dieser Entscheidung jedoch nicht auszuschließen.
C. 0
2=χ belegt eindeutig, daß die Nullhypothese richtig ist.
D. 0
2=χ belegt eindeutig, daß die Alternativhypothese richtig ist.
E. Ob man die Null- oder die Alternativhypothese annimmt, ist abhängig von der
Größe des α-Fehlers.
60 9 Statistische Tests
Aufgabe 9.14: Vierfeldertest
Welche Aussage trifft nicht zu?
A. Dem Vierfelder-Test liegt die Chi2-Verteilung zugrunde.
B. Die Anzahl der Freiheitsgrade beträgt immer 1.
C. Falls die Prüfgröße einen Wert größer als 3,84 annimmt, wird die Nullhypothese
zugunsten der Alternativhypothese abgelehnt.
D. Mit diesem Test läßt sich die Unabhängigkeit 2er Alternativmerkmale überprü-
fen.
E. Die Prüfgröße kann generell Werte zwischen
und
+
annehmen.
Aufgabe 9.15: Vorzeichentest
Welche Aussage ist falsch?
A. Der Vorzeichentest ist bei 2 verbundenen Stichproben mit einem quantitativ-
stetigen Merkmal anwendbar.
B. Das zugrunde liegende Modell ist die Binomialverteilung mit 5,0
=
p.
C. Der Test setzt 2 verbundene Stichproben mit gleichen Varianzen voraus.
D. Vor der Durchführung dieses Tests muß die Größe des α-Fehlers festgelegt
werden.
E. Er hat eine geringere Power als der t-Test, wenn dessen Voraussetzungen erfüllt
sind.
Aufgabe 9.16: Mehrfaches Testen
Gegeben seien 3 unverbundene Stichproben, die paarweise mit dem t-Test (jeweils
%5
=
α
) getestet werden. Insgesamt werden also 3 Tests durchgeführt. Wie groß ist
bei diesem Verfahren insgesamt der Fehler 1. Art?
A. 3/
α
B.
α
3
C.
α
31
D. 3
α
E. 3
)1(1 α
9 Statistische Tests 61
Aufgabe 9.1: Formulieren der Hypothesen
Lösung: B(Alternativhypothese)
Die Nullhypothese besagt immer, daß 2 Parameter (z. B. Erwartungswerte) gleich sind.
Die Alternativhypothese (also unterschiedliche Erwartungswerte) wird erst dann ange-
nommen, wenn die Prüfgröße schwer mit der Nullhypothese zu vereinbaren ist.
Aufgabe 9.2: Grundlagen
Lösung: E(Aussage ist falsch)
Aussagen A–D sind richtig. Annahme- und kritischer Bereich schließen sich aus (siehe
Tabelle Seite 210 und Abbildung Seite 211). Je größer der α-Fehler, desto kleiner der
ß-Fehler (und umgekehrt; siehe Seite 206). Die Frage, ob 1- oder 2-seitig getestet wird,
hat weniger mit Statistik als mit sachlogischen Überlegungen zu tun. Es ist auch leicht
nachvollziehbar, daß sich die Beobachtungseinheiten innerhalb einer Stichprobe nicht
beeinflussen dürfen, da sonst Ergebnisse verzerrt würden. Der Stichprobenumfang
(Antwort E) hat sehr wohl Einfluß auf das Ergebnis: ein kleiner Umfang führt eher zur
Beibehaltung der Nullhypothese, während ein extrem großer Umfang zur Annahme der
Alternativhypothese tendiert.
Aufgabe 9.3: Testentscheidungen
Lösung: A
Wenn die Prüfgröße nicht im Annahmebereich liegt, muß sie im kritischen Bereich
liegen – dann nimmt man die Alternativhypothese an und lehnt die Nullhypothese ab.
Zu B: die Größe des 1. Fehlers (α-Fehler) wird vor der Testdurchführung (üblicher-
weise mit α=5%) festgelegt, ist also nicht zufällig. Zu C: Wenn die Nullhypothese
beibehalten wird, kann dies auch dadurch begründet sein, daß deren Aussage tatsäch-
lich richtig ist – dann macht man keinen Fehler. Zu D: Der Ablehnungsbereich ist nicht
immer zusammenhängend (z. B. bei 2-seitigem t-Test, Abb. 9.1). Zu E: Wenn die
Alternativhypothese in Wirklichkeit richtig ist, kann man keinen α-Fehler machen
(höchstens einen ß-Fehler).
Aufgabe 9.4: α-Fehler
Lösung: D
Daß die Aussage D richtig ist, wird an der Tabelle 9.1 auf Seite 206 klar. Zu A und B:
diese Entscheidungen wären richtig; es sind keine Fehler. Unter C wird der ß-Fehler
beschrieben. Zu E: diese Formulierung ist schlecht. Die Alternativhypothese kann man
annehmen, aber nicht ablehnen (der Test geht ja von der Nullhypothese aus).
62 9 Statistische Tests
Aufgabe 9.5: Tests und Merkmale
Lösung: D(Chi2-Homogenitätstest)
Für qualitative Merkmale eignen sich generell Chi2-Tests. t-Tests und Rangsummen-
tests setzen stetige (also quantitative) Daten voraus; ebenso der F-Test, der die Gleich-
heit 2er Varianzen untersucht.
Aufgabe 9.6: ß-Fehler – Allgemeines
Lösung: C(abhängig vom Stichprobenumfang)
Der ß-Fehler kann nicht festgelegt werden; seine Größe ist von vielen Faktoren abhän-
gig (A und B sind falsch). Die Güte eines Tests läßt sich ausdrücken als 1–ß (das ist die
Wahrscheinlichkeit, bei Gültigkeit der Alternativhypothese ein signifikantes Test-
ergebnis zu erhalten). Damit ist D falsch. Auch E ist falsch: je kleiner α, um so größer
wird ß (und umgekehrt). Durch einen großen Stichprobenumfang, der üblicherweise
vor der Testdurchführung festgelegt wird, läßt sich ß jedoch klein halten (Antwort C).
Aufgabe 9.7: ß-Fehler beim t-Test
Lösung: D(größere Varianz)
Durch A–C wird der ß-Fehler verkleinert (siehe Aufgabe 9.6 und Ausführungen Seite
206f.). Es ist logisch, daß sich bei kleinerer Varianz ein Unterschied einfacher nach-
weisen läßt, was ebenfalls zu einer Verkleinerung des ß-Fehlers führt (E). Umgekehrt
bewirkt eine Vergrößerung der Varibilität der Meßwerte, daß sich ein Unterschied
schwerer nachweisen läßt – also eine Vergrößerung des ß-Fehlers.
Aufgabe 9.8: Nicht-signifikantes Testergebnis
Lösung: E(vorsichtige Interpretation)
Mit einem Testergebnis läßt sich nichts beweisen – Antworten A und B sind offen-
kundig Unsinn. Ebenso C: ein eventueller Unterschied bzgl. der Wirkung ist nicht vom
Zufall abhängig und kann deshalb nicht mit einer Wahrscheinlichkeit quantifiziert
werden (siehe auch Anmerkung auf Seite 208). Zu voreilig wäre die Interpretation nach
D. Anzuraten sind in jedem Fall vorsichtige Schlußfolgerungen, wie sie in Antwort E
formuliert werden.
9 Statistische Tests 63
Aufgabe 9.9: Voraussetzungen
Lösung: A(t-Tests)
t-Tests setzen generell normalverteilte Daten voraus, auch wenn diese Voraussetzungen
bei praktischen Anwendungen abgeschwächt werden können. Rangsummentests
werden bei quantitativen Merkmalen verwendet, wenn diese Voraussetzungen nicht er-
füllt sind. Chi2-Tests setzten qualitative Merkmale voraus.
Aufgabe 9.10: Auswahl eines Tests bei normalverteilten Daten
Lösung: A(t-Test für 2 unverbundene Stichproben)
Man sollte generell alle Informationen so weit wie möglich ausnutzen. Wenn also be-
kannt ist, daß die Daten normalverteilt sind und die Varianzen gleich sind, sollte man
den t-Test benutzen (der diese Eigenschaften voraussetzt). Die anderen beiden Tests
haben schwächere Voraussetzungen (Welch-Test: keine gleich großen Varianzen, U-
Test: keine Normalverteilung). Obgleich deren Voraussetzungen auch erfüllt sind, wäre
es leichtsinnig, diese Tests hier anzuwenden – sie haben nämlich eine geringere Power,
und es ist schwieriger, einen Unterschied nachzuweisen. E ist also falsch, ebenso wie D:
man sollte sich immer vor der Testdurchführung überlegen, welcher Test geeignet ist
und nicht versuchen, im nachhinein zu manipulieren.
Aufgabe 9.11: Auswahl eines Tests bei schief-verteilten Daten
Lösung: C(U-Test)
Zunächst fallen der t-Test für verbundene Stichproben und der Vorzeichentest weg, da
hier 2 unverbundene Stichproben vorliegen. Da die Voraussetzungen des t-Tests (auch
des Welch-Tests) bzgl. Normalverteilung (u. a. wegen der kleinen Stichprobenum-
fänge) nicht einmal annähernd erfüllt sind, kann man diese nicht anwenden. Bleibt also
nur noch der U-Test (der auch schief-verteilte Daten zuläßt).
Aufgabe 9.12: t-Test für 2 unverbundene Stichproben
Lösung: B(Umfänge müssen nicht gleich groß sein)
Dieser Test hat formal sehr strenge Voraussetzungen (siehe Abschnitt 9.2.3 im Buch),
aber die Stichprobenumfänge müssen nicht gleich groß sein. Sie sollten aber wegen der
Power nicht allzu unterschiedlich sein.
64 9 Statistische Tests
Aufgabe 9.13: Chi2-Test
Lösung: B(Nullhypothese beibehalten)
Eine Prüfgröße mit dem Wert 0 kann sich durchaus ergeben, wenn nämlich bcad
=
(siehe Vierfeldertafel Seite 236). A ist also falsch. Mit einem Testergebnis – auch mit
einem extremen – läßt sich nichts eindeutig belegen; demnach sind C und (erst recht) D
falsch. Ebenso E: das Ergebnis liegt im Annahmebereich, deshalb muß man immer die
Nullhypothese beibehalten. Eine vorsichtige Interpretation nach B ist angebracht.
Aufgabe 9.14: Vierfeldertest
Lösung: E(Prüfgröße ist nicht negativ)
Falsch ist E. Die Prüfgröße 2
χ beim Vierfeldertest ist – wie bei allen Chi2-Tests – grö-
ßer oder gleich 0. Alle anderen Aussagen sind richtig (siehe Abschnitt 9.5.1).
Aufgabe 9.15: Vorzeichentest
Lösung: C(gleiche Varianzen werden nicht vorausgesetzt)
Der Vorzeichentest wird normalerweise angewandt zum Vergleich eines stetigen
Merkmals bei 2 verbundenen Stichproben (Antwort A). Weiter beinhaltet er keine
Voraussetzungen – auch nicht gleiche Varianzen. Das Testverfahren basiert auf der
Binomialverteilung; unter der Nullhypothese gilt: 5,0)()(
=
<
=
>
YXPYXP (Ant-
wort B). Der α-Fehler muß immer vor der Durchführung festgelegt werden (Antwort
D); dies ist keine Besonderheit des Vorzeichentests. Auch Antwort E ist richtig; der
Vorzeichentest ist zwar universeller anwendbar, führt aber seltener zu einem signifi-
kanten Ergebnis als der entsprechende t-Test.
Aufgabe 9.16: Mehrfaches Testen
Lösung: E(%14)1(1 3α )
Wenn die Nullhypothese richtig ist, beträgt die Wahrscheinlichkeit, die Nullhypothese
aufgrund des Testergebnisses beizubehalten %95)1(
=
α
. Bei 3 Tests, die unabhängig
voneinander durchgeführt werden, ist diese Wahrscheinlichkeit %86)1( 3α (falls
%5
=
α
). Die Wahrscheinlichkeit, einmal fälschlicherweise eine Entscheidung
zugunsten der Alternativhypothese zu treffen, beträgt dann %14)1(1 3α . Dieser
Wert ist fast 3mal so groß wie α – d. h. bei mehrfachem Testen steigt der Fehler 1. Art
an.
10 Grundlagen der Versuchsplanung 65
Teil IV: Versuchsplanung
10 Grundlagen der Versuchsplanung
Aufgabe 10.1: Zufällige Stichproben
Von 20.000 Anästhesien sollen in den folgenden Monaten etwa 2.000 für eine
Stichprobe ausgewählt und unter verschiedenen Gesichtspunkten ausgewertet werden.
Die unter 1–5 genannten Verfahren liefern ungefähr die benötigte Anzahl. Welche der
folgenden Mengen stellen zufällige Stichproben dar?
1. alle Anästhesien, für die bestimmte Oberärzte verantwortlich sind
2. alle Anästhesien, die an Patienten durchgeführt werden, deren Nachnamen mit
einem der Buchstaben A–C beginnen
3. alle Anästhesien von Patienten, deren Geburtsdatum im Paß der 1., 2. oder 3.
eines Monats ist
4. alle Anästhesien, die von der allgemeinchirurgischen Klinik durchgeführt wird
5. alle Anästhesien von Patienten im Alter zwischen 20 und 29 Jahren
6. alle Anästhesien, die montags durchgeführt werden
A. Alle Stichproben sind zufällig.
B. Nur 1–4 sind zufällig.
C. Nur 2–4 und 6 sind zufällig.
D. Nur 2 und 3 sind zufällig.
E. Keine Stichprobe ist zufällig.
Aufgabe 10.2: Repräsentative Stichprobe
Im Rahmen einer Doktorarbeit soll untersucht werden, wie die Heilung bei 120 Pati-
enten verlaufen ist, die im vergangenen Jahr an einem Finger operiert worden sind. Zur
Datenerhebung schickt man jedem dieser Patienten einen Fragebogen mit der Bitte,
diesen auszufüllen und zurückzusenden. Man erhält die ausgefüllten Bögen von 80
Patienten. Kann man dann davon ausgehen, daß diese 80 Patienten eine repräsentative
Stichprobe der 120 operierten Patienten darstellen?
A. Ja, da der Stichprobenumfang 80
=
nsehr groß ist
B. Ja, da der Stichprobenumfang im Verhältnis zur Grundgesamtheit sehr groß ist
C. Ja, da die Teilnahme an der Fragebogenaktion freiwillig erfolgte
D. Eine Antwort auf diese Frage hängt von den Skalenniveaus der auszuwertenden
Merkmale ab.
E. Nein
66 10 Grundlagen der Versuchsplanung
Aufgabe 10.3: Versuchsplanung
Zu welchem Zeitpunkt sollte man sich bei einer klinischen Studie überlegen, welche
statistische Analysemethode(n) verwendet werden sollen?
A. vor dem Formulieren der Fragestellungen
B. vor Beginn der Datensammlung
C. unmittelbar nachdem alle Daten vorliegen (vorher ist nicht möglich)
D. der geeignete Zeitpunkt ergibt sich von selbst im Laufe der Studie
E. dieser Zeitpunkt ist irrelevant
Aufgabe 10.4: Systematischer Fehler
Was trägt – wenn mehrere Stichproben untersucht werden – nicht dazu bei, den syste-
matischen Fehler zu vermeiden?
A. Beobachtungsgleichheit
B. Strukturgleichheit
C. die Wahl eines geeigneten statistischen Modells
D. große Stichproben
E. repräsentative Stichproben
Aufgabe 10.5: Zufälliger Fehler
Was können Ursachen für einen großen zufälligen Fehler sein?
1. kleine Stichproben
2. die intraindividuelle Variabilität der Beobachtungseinheiten
3. der interindividuelle Variabilität der Beobachtungseinheiten
4. nicht-repräsentative Stichproben
5. fehlerhaft durchgeführte Messungen (z. B. falsch geeichtes Meßgerät)
A. alles unter 1–5
B. nur 1–3
C. nur 1–4
D. nur 2 und 3
E. nur 1
Aufgabe 10.6: Blockbildung
Zum Vergleich 2er Augensalben bildet man sinnvollerweise aus den Augenpaaren
mehrerer Patienten Blöcke. Welche Aussagen treffen zu?
1. Durch das Bilden von Blöcken wird der systematische Fehler weitgehend aus-
geschaltet.
2. Innerhalb eines Blocks wird randomisiert.
10 Grundlagen der Versuchsplanung 67
3. Die Randomisierung trägt zur Strukturgleichheit der beiden Behandlungsgrup-
pen bei.
4. Die Blockbildung trägt zur Beobachtungsgleichheit bei.
5. Der Einfluß von Störgrößen wird ausgeschaltet.
A. nur 2 und 3
B. nur 1, 3 und 5
C. nur 3, 4 und 5
D. nur 2, 3 und 4
E. nur 1, 3, 4 und 5
Aufgabe 10.7: Bilden von Schichten
Bei größeren Untersuchungen faßt man Beobachtungseinheiten, die sich in wesentli-
chen Eigenschaften ähneln, in einer Schicht zusammen. Was ist daran vorteilhaft?
1. Dadurch wird der systematische Fehler ausgeschaltet.
2. Es entstehen übersichtliche Gruppen.
3. Der zufällige Fehler wird reduziert.
4. Der Versuchsfehler insgesamt wird reduziert.
5. Unterschiede zwischen den einzelnen Schichten sind dann klarer erkennbar.
A. 1–5
B. nur 2 und 3
C. nur 2–4
D. nur 2–5
E. nur 1 und 3
Aufgabe 10.8: Anzahl von Schichten
Bei einer klinischen Untersuchung erscheint es wünschenswert, nach 3 Merkmalen zu
schichten: 1. nach Geschlecht, 2. nach Alter (5 Klassen von jeweils 10 Jahren) und 3.
nach Krankheitsstatus (leicht, mittelmäßig und schwer erkrankt). Wie viele Schichten
ergeben sich bei diesem Verfahren?
A. 1
B. 3
C. 30
D. 60
E. Die Anzahl der Schichten ergibt sich erst im Laufe der Untersuchung.
68 10 Grundlagen der Versuchsplanung
Aufgabe 10.9: Zuteilen zu Behandlungsgruppen
Eine streng zufällige Zuteilung auf 2 Behandlungsgruppen wird am ehesten erzielt
A. mit Hilfe eines Würfels oder einer Zufallszahl
B. indem man den Patienten die Gruppe wählen läßt
C. indem man den behandelnden Arzt die Gruppe wählen läßt
D. indem man eine zufällig anwesende Person bittet, eine Zahl zwischen 1 und 8 zu
nennen und die Gruppenzuteilung vornimmt, je nachdem ob die genannte Zahl
gerade oder ungerade ist
E. durch systematisches Alternieren
Aufgabe 10.10: Doppelblindstudien
Wozu trägt die Doppelblindheit bei klinischen Studien nicht bei?
A. systematische Fehler zu vermeiden
B. Beobachtungsgleichheit zu erreichen
C. Datenschutz zu gewährleisten
D. Autosuggestion auf Seiten des behandelnden Arztes auszuschalten
E. Autosuggestion auf Seiten der Patienten auszuschalten
10 Grundlagen der Versuchsplanung 69
Aufgabe 10.1: Zufällige Stichproben
Lösung: E(keine)
Zufällig bedeutet: jedes Element der Grundgesamtheit hat dieselbe Chance, in die
Stichprobe zu gelangen. Damit ist eigentlich klar, daß keine dieser Stichproben zufällig
ist; sie sind alle irgendwie systematisch. Man darf deshalb auch nicht annehmen, daß sie
repräsentativ für die Menge aller Anästhesien sind. Zu 1: Oberärzte führen schwierigere
OPs durch als beispielsweise AIP-ler. Zu 2: Damit wären evtl. Mitglieder einer Familie
mit dem selben Namen oder auch Patienten aus bestimmten Ländern übermäßig häufig
vertreten. Zu 3: Hier ist zu berücksichtigen, daß bei einigen Leuten das Geburtsdatum
nicht bekannt ist und im Paß dann oft der 1. eines Monats eingetragen ist. Zu 4: Die
Allgemeinchirurgie ist eine Klinik und nicht repräsentativ für alle operativen Fächer. Zu
5: Eine einzige Altersgruppe kann unmöglich repräsentativ für alle Patienten sein. Zu 6:
Montags gibt es hauptsächlich planmäßige Operationen (und weniger Notfälle als am
Wochenende). Fazit: Am ehesten erhält man eine zufällige (und damit repräsentative)
Stichprobe, wenn man einen Zufallszahlengenerator entscheiden läßt. Falls dies nicht
möglich ist, wird manchmal eine systematische Stichprobe gezogen (am ehesten nach 2
oder 3). Dabei muß man aber sehr aufpassen, daß man keinen allzu großen systemati-
schen Fehler begeht.
Aufgabe 10.2: Repräsentative Stichprobe
Lösung: E(nein)
Zunächst: ob eine Stichprobe repräsentativ ist, hängt nicht mit ihrer Größe oder den
Merkmalen zusammen. A, B und D sind demnach falsch. Daß die Teilnahme freiwillig
erfolgte, ist keinerlei Hinweis auf Repräsentativität (Antwort C). Man muß in jedem
Fall nach den Gründen fragen, aus denen immerhin 40 Patienten ihren Bogen nicht aus-
gefüllt haben. Das könnte damit zusammenhängen, daß sie Schwierigkeiten mit dem
operierten Finger haben und deshalb nicht schreiben können. Wenn man diese 40 Pati-
enten nicht berücksichtigt, würden die Ergebnisse der Studie sehr verzerrt werden (sy-
stematischer Fehler). Fazit: Fragebogenaktionen sind immer problematisch. Man sollte
in jedem Fall bei Nicht-Respondern nachhaken und versuchen, die Gründe für die
Nicht-Teilnahme herauszufinden. Besser ist die Interview-Technik.
Aufgabe 10.3: Versuchsplanung
Lösung: B(vor Datenerhebung)
Man sollte so früh wie möglich überlegen, welche Analysemethoden angewandt wer-
den. Vor dem Formulieren der Fragestellungen wäre allerdings zu früh (Antwort A):
zunächst müssen ja alle Merkmale bekannt sein, die man auswerten will – und diese
ergeben sich erst aus der Fragestellung. Aus den gewählten Verfahren ergeben sich der
benötigte Stichprobenumfang und damit wichtige Informationen zum weiteren Ablauf
der Studie. Nachdem die Daten vorliegen (Antwort C) wäre also spät. Die Antworten
D und E sind offensichtlich unsinnig.
70 10 Grundlagen der Versuchsplanung
Aufgabe 10.4: Systematischer Fehler
Lösung: D(große Stichproben)
Große Stichproben tragen dazu bei, den zufälligen Fehler zu reduzieren; repräsentative
Stichproben tragen dazu bei, den systematischen zu vermeiden. Auch Beobachtungs-
und Strukturgleichheit 2er Stichproben sind wichtig (sonst würde man Äpfel mit Birnen
vergleichen; Antworten A und B). Ein ungeeignetes Modell (Antwort C) kann zu
verzerrten Ergebnissen und damit auch zu einem systematischen Fehler führen.
Aufgabe 10.5: Zufälliger Fehler
Lösung: B (nur 1–3)
Je kleiner der Stichprobenumfang ist und je mehr die Meßwerte variieren, um so größer
wird der zufällige Fehler (der Standardfehler des Mittelwerts ist ns/; siehe Seite
267). Die intra- und interindividuelle Variabilität sind hier maßgebend. An dieser Stelle
sei darauf hingewiesen, daß im Buch intra- und interindividuelle Variabilität
verwechselt ist (Seite 266). Es muß heißen: interindividuelle Variabilität: bei mehre-
ren Beobachtungseinheiten erhält man beim Messen einer Größe unterschiedliche Er-
gebnisse) und intraindividuellen Variabilität: bei einer Beobachtungseinheit ergeben
sich beim Messen einer Größe unter denselben Bedingungen unterschiedliche Werte.
Pardon! Zu den Punkten 4 und 5: nicht-repräsentative Stichproben und fehlerhafte
Messungen sind verantwortlich für den systematischen Fehler.
Aufgabe 10.6: Blockbildung
Lösung: A (nur 2 und 3)
Richtig ist: durch die Blockbildung wird der zufällige Fehler innerhalb eines Blocks
reduziert (weil sich dessen Einheiten weitgehend gleichen). Mit dem systematischen
Fehler hat dies zunächst nichts zu tun; also ist 1 falsch. Innerhalb des Blockes wird
randomisiert; das heißt, der Zufall entscheidet, welches Auge mit welcher Therapie
behandelt wird. Dadurch erhält man 2 Gruppen (die jeweils genau ein Auge von jedem
Patienten enthalten), die sich in wesentlichen Eigenschaften gleichen, und trägt damit
zur Strukturgleichheit bei. Also sind 2 und 3 richtig. Die Beobachtungsgleichheit (z. B.
gleiche Meßmethoden in beiden Gruppen) wird nicht durch die Blockbildung beein-
flußt; ebenso wenig werden Störgrößen dadurch ausgeschaltet (diese lassen sich nie
komplett ausschalten). Daher sind 4 und 5 falsch.
Aufgabe 10.7: Bilden von Schichten
Lösung: D(nur 2–5)
Bei Schichten handelt es sich wie bei Blöcken um übersichtliche, weitgehend homogene
Gruppen, wodurch der zufällige Fehler innerhalb einer Schicht reduziert wird. Dadurch
10 Grundlagen der Versuchsplanung 71
wird auch der gesamte Versuchsfehler, der sich aus dem zufälligen und dem systemati-
schen Fehler zusammensetzt, reduziert. Es ist klar, daß dann Unterschiede zwischen
den Schichten deutlicher sind. Also sind 2–5 richtig. Mit dem systematischen Fehler hat
dies nichts zu tun; 1 ist also falsch.
Aufgabe 10.8: Anzahl von Schichten
Lösung: C(30)
Dies ist leicht auszurechnen, indem man die Anzahl der Merkmalsausprägungen bzw.
Klassen multipliziert: 30)statusKrankheits(3)senAltersklas(5)Geschlecht(2
=
. Dies
zeigt, daß eine Schichtung nach wichtigen Einflußfaktoren zwar wünschenswert ist, in
der Praxis aber an Grenzen stößt, weil sehr viele Beobachtungseinheiten erforderlich
wären.
Aufgabe 10.9: Zuteilen zu Behandlungsgruppen
Lösung: A(Würfel)
Alles andere wäre eine Zuteilung nach einem bestimmten System und damit nicht zu-
fällig, auch wenn dies auf den ersten Blick nicht erkennbar ist. Sowohl die Patienten als
auch der behandelnde Arzt können subjektiven Einflüssen bei der Wahl der Be-
handlungsgruppe unterliegen (B und C). Wenn man irgend eine Person bittet, eine Zahl
zwischen 1 und 8 zu wählen, wird erfahrungsgemäß die 7 am häufigsten genannt (D).
Auch systematisches Alternieren kann nicht gewährleisten, daß die Zuteilung zufällig
erfolgt (E).
Aufgabe 10.10: Doppelblindstudien
Lösung: C(Datenschutz nicht gewährleistet)
Studien werden doppelblind durchgeführt, um Autosuggestion zu vermeiden (D und
E). Dies trägt zur Beobachtungsgleichheit und damit zur Vermeidung systematischer
Fehler bei (B und A). Mit dem Datenschutz hat dies aber nichts zu tun.
72 11 Studientypen
11 Studientypen
Aufgabe 11.1: Studie bzgl. OP-Risiken
In einer Klinik sollen die Häufigkeiten für das Auftreten von Komplikationen bei Ope-
rationen und deren mögliche Ursachen untersucht werden. Als Grundlage werden alle
Anästhesieprotokolle aus den vergangenen 12 Monaten herangezogen. Um welchen
Studientyp handelt es sich?
A. retrospektve Studie
B. prospektive Studie
C. klinisch-kontrollierte Studie
D. Kohortenstudie
E. Experiment
Aufgabe 11.2: Fall-Kontroll-Studien
Welche Aussage bzgl. Fall-Kontroll-Studie ist richtig?
A. Es handelt sich um prospektive Studien.
B. Die Anzahl der Fälle muß immer gleich der Anzahl der Kontrollen sein.
C. Diese Studien dienen in der Regel zur Klärung ätiologischer Faktoren.
D. Es besteht die Notwendigkeit, Patienten mehrfach zu untersuchen.
E. Die Matched-Pairs-Technik dient der Beobachtungsgleichheit.
Aufgabe 11.3: Retrospektive Studien
Welche möglichen Nachteile haben retrospektive Studien?
1. mangelhafte Datenqualität
2. kein Einfluß auf die Wahl der Beobachtungseinheiten
3. erhöhter Zeitbedarf im Vergleich zu prospektiven Studien
4. meist wesentlich höhere Kosten als bei prospektiven Studien
5. sie sind nicht geeignet, um kausale Zusammenhänge nachzuweisen
A. 1–5 sind richtig
B. nur 1–3 ist richtig
C. nur 1 und 2 sind richtig
D. nur 1, 2 und 5 sind richtig
E. nur 1 ist richtig
11 Studientypen 73
Aufgabe 11.4: Matched-Pairs-Technik
Warum wird bei einigen Fall-Kontroll-Studien die Matched-Pairs-Technik angewandt?
A. Um gleich große Gruppen zu erhalten.
B. Um Strukturgleichheit zu erreichen.
C. Um Beobachtungsgleichheit zu erreichen.
D. Um Störgrößen auszuschalten.
E. Um den zufälligen Fehler zu reduzieren.
Aufgabe 11.5: Kontrollierte klinische Therapiestudien
Worauf ist das Attribut kontrolliertzurückzuführen?
A. darauf, daß der α-Fehler kontrollierbar ist
B. auf die Kontrollgruppe
C. darauf, daß der Umfang der Behandlungsgruppen kontrolliert werden kann
D. darauf, daß der Therapieerfolg in Abhängigkeit der Behandlungsform evaluiert
werden kann
E. darauf, daß die Ausprägungen der Einflußgrößen (also die Behandlungsform)
vorgegeben werden kann
Aufgabe 11.6: Prospektive Studien
Welche Aussage trifft nicht zu? Bei einer prospektiven Studie
A. geht man oft von einer Gruppe von exponierten und einer Gruppe von nicht-
exponierten Personen aus
B. muß man meist längere Zeit auf das Eintreten der Zielereignisse warten
C. handelt es sich um eine Beobachtungsstudie
D. werden die Ausprägungen der Einflußfaktoren vom behandelnden Arzt be-
stimmt
E. hat der Versuchsleiter Einfluß auf die Datenerfassung und die vollständige und
richtige Dokumentation der Daten
Aufgabe 11.7: Klinisch kontrollierte Studien – Eigenschaften
Welche Aussage bezüglich randomisierter, klinischer Therapiestudien trifft nicht zu?
A. Doppelblindheit ist unbedingt erforderlich.
B. Struktur- und Beobachtungsgleichheit sind unbedingt erforderlich.
C. Kein Patient darf gezwungen werden, an einer solchen Studie teilzunehmen.
D. Die Randomisierung dient der Strukturgleichheit.
E. Sie kommt in ihrer wissenschaftlichen Aussagekraft einem Experiment nahe.
74 11 Studientypen
Aufgabe 11.8: Klinisch kontrollierte Studien – Vorgehensweise
Im Rahmen einer klinischen Therapiestudie soll ein neu entwickeltes Medikament N ge-
gen die herkömmliche Standardtherapie S getestet werden. Welche Vorgehensweise ist
korrekt?
A. Man teilt die Patienten zufällig einer der Therapien N oder S zu und behandelt
die beiden Gruppen im selben Zeitraum in 2 verschiedenen Krankenhäusern.
B. Man behandelt nur eine Gruppe mit N und vergleicht dann mit einer Gruppe, die
in der Vergangenheit mit S behandelt wurde.
C. Um Risiken zu vermeiden, behandelt man die leichter erkrankten Patienten mit
N und die schwereren Fälle mit S (gleichzeitig, in der selben Einrichtung).
D. Man teilt die Patienten zufällig einer der Therapien N oder S zu. Die beiden
Gruppen werden gleichzeitig und von demselben Personal behandelt und beob-
achtet.
E. Man läßt die Patienten entscheiden, ob sie mit N oder S behandelt werden
wollen.
Aufgabe 11.9: Vergleich retrospektive und prospektive Studie
Es soll untersucht werden, ob die Rauchgewohnheiten schwangerer Frauen einen Ein-
fluß auf das Auftreten von Frühgeburten haben. Dies ist theoretisch mit einer retro-
oder einer prospektiven Studie möglich. Welche der folgenden Aussagen ist falsch?
A. Eine retrospektive Studie basiert auf einer Gruppe von Müttern mit frühgebo-
renen Kindern und einer anderen Gruppe, deren Babys nach normaler Schwan-
gerschaftsdauer zur Welt kamen.
B. Wenn die Studie prospektiv durchgeführt wird, ist es sinnvoll, eine große An-
zahl schwangerer Frauen (bestehend aus Nicht-Raucherinnen, schwachen, mä-
ßigen und starken Raucherinnen) heranzuziehen.
C. Beide Studientypen sind geeignet, einen kausalen Zusammenhang zwischen
Rauchgewohnheiten werdender Mütter und Frühgeburten nachzwueisen.
D. Die Daten der retrospektiven Studie können sofort analysiert werden, während
man bei der prospektiven Studie mehrere Monate warten muß.
E. Bei beiden Studientypen handelt es sich um Beobachtungsstudien.
Aufgabe 11.10: Letzte Aufgabe
Eine pharmazeutische Firma hat ein neues Schmerzmittel entwickelt und läßt dies von
10 verschiedenen Kliniken unter annähernd gleichen Bedingungen gegen ein Placebo
testen. Die Ergebnisse werden für jede einzelne Klinik mit dem selben statistischen
Testverfahren ausgewertet, wobei jeweils %5
=
α
festgelegt wird. Nur bei einer einzi-
gen Klinik XY konnte ein signifikanter Unterschied nachgewiesen werden. Daraufhin
veröffentlicht die Firmenleitung einen Fachartikel mit den Untersuchungsergebnissen
der Klinik XY und schreibt: „Die schmerzstillende Wirkung unseres neu-entwickelten
Präparats wurde in einer Untersuchung an der Klinik XY nachgewiesen ( %5
=
α
).
Wie beurteilen Sie dieses Verfahren?
11 Studientypen 75
A. Dies ist korrekt, weil ja nur die Ergebnisse der Klinik XY publiziert werden.
B. Dies ist korrekt, weil der α-Fehler angegeben wurde.
C. Man kann dies nur beurteilen, wenn man den gesamten Artikel gelesen hat.
D. Dieses Verfahren ist abzulehnen, weil es nicht zu verantworten ist, gegen ein
Placebo zu testen.
E. Diese Vorgehensweise grenzt an Betrug und ist rundweg abzulehnen.
76 11 Studientypen
Aufgabe 11.1: Studie bzgl. OP-Risiken
Lösung: A(retrospektiv)
Die relevanten Ereignisse geschahen in der Vergangenheit und werden im nachhinein
analysiert. Dies ist das Kennzeichen einer retrospektiven Studie (siehe Seite 269). Hier
wird der Nachteil dieser Studienart bzgl. der mangelhaften Datenqualität sehr deutlich:
man kann nicht damit rechnen, daß jeder Anästhesist die aufgetretenen Komplikationen
fein säuberlich und vollständig dokumentiert hat.
Aufgabe 11.2: Fall-Kontroll-Studien
Lösung: C(zur Klärung ätiologischer Faktoren)
Man geht aus von einer Gruppe erkrankter Personen (Fälle) und einer Gruppe nicht-er-
krankter (Kontrollen) und versucht, mögliche Ursachen für diese Krankheit herauszu-
finden. Es handelt sich um eine retrospektive Studie (A ist falsch); die Anzahl der Fälle
muß nicht unbedingt der Anzahl der Kontrollen entsprechen; oft steht eine Kontroll-
Gruppe zur Verfügung, die sehr viel größer ist als die Gruppe der Fälle (B ist falsch).
Patienten müssen nicht untersucht werden, weil die relevanten Ereignisse bei Studien-
beginn bereits eingetreten sind (D ist falsch). Wenn Matched-Pairs-Technik angewandt
wird (dies muß nicht sein), dient dies der Strukturgleichheit (E ist falsch).
Aufgabe 11.3: Retrospektive Studien
Lösung: D(1, 2 und 5)
Weil bei dieser Studienart die Ereignisse bereits eingetreten sind, muß man auf alte
Dokumente zurückgreifen oder Patienten befragen. Man kann nicht unbedingt sicher
sein, daß alle Daten richtig und vollständig dokumentiert sind oder daß man bei Befra-
gungen richtige Antworten erhält. Im nachhinein hat man auch keinen Einfluß mehr auf
die Auswahl der Beobachtungseinheiten. Deshalb sind 1 und 2 richtig. Man kann zwar
evtl. Zusammenhänge nachweisen, aber es wäre zu gewagt, Kausalitäten herzuleiten.
Dafür eignen sich prospektive (oder noch besser: experimentelle) Studien weit mehr.
Also ist 5 richtig. – Der Zeitbedarf und die Kosten sind allerdings bei retrospektiven
Studien weit geringer als bei prospektiven (3 und 4 sind also falsch).
Aufgabe 11.4: Matched-Pairs-Technik
Lösung: B(Strukturgleichheit)
Man sucht dabei zu jedem Fall eine passende Kontrolle (siehe Seite 274). Damit er-
reicht man, daß die beiden Gruppen bzgl. wichtiger Einflußgrößen ähnlich sind
(Strukturgleichheit). Man erreicht damit auch, daß die beiden Gruppen gleich groß sind
– dies ist aber ein Nebeneffekt und nicht der eigentliche Sinn dieser Technik (das
könnte man auch einfacher erreichen). A ist also falsch. Zu C, D und E: Mit Beobach-
11 Studientypen 77
tungsgleichheit hat dies nichts zu tun; Störgrößen werden dadurch nicht ausgeschaltet
(das geht generell nicht). Die Strukturgleichheit trägt dazu bei, den systematischen
Fehler auszuschalten, nicht den zufälligen zu reduzieren.
Aufgabe 11.5: Kontrollierte klinische Therapiestudie
Lösung: E(Einflußgrößen sind kontrollierbar)
Hierin ähnelt eine klinische Studie einem Experiment, bei dem ja auch vom Ver-
suchsleiter die Einflußgrößen vorgegeben werden (man spricht dann von kontrollierten
Bedingungen). Der wesentliche Unterschied zu einem Experiment besteht darin, daß
das Wohl des Patienten im Vordergrund steht und daß deshalb – falls erforderlich – der
behandelnde Arzt modifizierend eingreifen darf.
Aufgabe 11.6: Prospektive Studien
Lösung: D(ist falsch)
Typisch ist die unter A beschriebene Situation: man geht von einem Kollektiv gesunder
Personen (exponierte und nicht-exponierte) aus und wartet, bis eine bestimmte
Krankheit eintritt. Dies dauert oft lange (B ist richtig). Dabei werden die Personen nur
beobachtet; d. h. es werden keine Ausprägungen vorgegeben (C richtig, D falsch).
Vorteilhaft ist, daß der Versuchsleiter es in der Hand hat, vollständige und richtige
Daten zu erhalten (E, im Gegensatz zu einer retrospektiven Studie).
Aufgabe 11.7: Klinisch-kontrollierte Studien – Eigenschaften
Lösung: A(Doppelblindheit ist nicht erforderlich)
Doppelblindheit ist zwar wünschenswert, aber nicht immer realisierbar (z. B. bei chir-
urgischen Eingriffen). Alles andere (Antworten B–E) ist richtig. Strukturgleichheit und
Beobachtungsgleichheit sind immer erforderlich, wenn mehrere Gruppen verglichen
werden. Siehe auch Seite 275ff.
Aufgabe 11.8: Klinisch-kontrollierte Studien – Vorgehensweise
Lösung: D
Nur bei dieser Vorgehensweise ist Beobachtungs- und Strukturgleichheit möglich. Bei
A (verschiedene Kliniken) wäre Beobachtungsgleichheit nicht gegeben. Auch nicht bei
B, weil hier die Zeit als Störgröße die Ergebnisse evtl. verzerren könnte. Dieses Ver-
fahren kann nur unter ganz bestimmten Bedingungen angewandt werden (z. B. wenn
ein neues Medikament geprüft wird, das lebensrettend ist und für das keine Alternative
existiert). Der Vorschlag unter C würde zu sehr verzerrten Ergebnissen führen, die gar
78 11 Studientypen
nicht sinnvoll interpretierbar sind. Auch das Verfahren unter E ist nicht zufällig und
deshalb abzulehnen.
Aufgabe 11.9: Vergleich retrospektive und prospektive Studie
Lösung: C(kausaler Zusammenhang kann nicht nachgewiesen werden)
Es ist allenfalls möglich, einen Zusammenhang nachzuweisen. Die Frage, ob eine
Frühgeburt durch die Rauchgewohnheiten der Mütter kausal bedingt ist, kann mit einer
retrospektiven Studie jedoch nicht beantwortet werden. Eine prospektive Studie kann
zwar auch keinen kausalen Zusammenhang nachweisen (dazu müßte man ein Experi-
ment durchführen); sie hat jedoch eine wissenschaftlich höhere Aussagekraft als eine
retrospektive Studie.
Aufgabe 11.10: Letzte Aufgabe
Lösung: E(Betrug)
Dieses Verfahren ist wissenschaftlich in allerhöchstem Maße unseriös. Nicht etwa weil
mit einem Placebo verglichen wird (eine Placebostudie kann durchaus gerechtfertigt
und ethisch vertretbar sein), sondern weil bei 10-maligem Testen die Wahrscheinlich-
keit, unter der Nullhypothese eine falsche Entscheidung zu treffen, sehr groß ist (der
Fehler 1. Art beträgt dann nicht 0,05, sondern 40,095,01 10 ). Wenn die Firma in
hinreichend vielen Kliniken testen läßt, wird sie bestimmt irgendwo rein zufällig einen
Unterschied bzgl. der Wirksamkeit (fälschlicherweise) nachweisen können. In einer
Publikation müßten korrekterweise die Ergebnisse aus allen Kliniken dargestellt wer-
den; dies wäre allerdings wenig werbewirksam.
Errata im Buch 79
Errata im Buch
Fehler lassen sich trotz größter Bemühungen wohl nie ganz vermeiden. Diese traten
vorwiegend in der letzten Phase der Erstellung auf, als zum x. Male alles durchgelesen,
überprüft und verbessert wurde. Dabei wurde an einigen Stellen etwas zuviel des Guten
getan. Der Leser möge dies bitte entschuldigen und die entsprechenden Stellen in
seinem Buch korrigieren.
Kapitel 3, Seite 54:
Die Indizes vom Summenzeichen in Formel (3.20) laufen von 1 bis k (dabei ist k die
Klassenanzahl), nicht bis n (das wäre der Stichprobenumfang). Die Formel ist abgeleitet
von (3.19).
Kapitel 4, Seite 77:
Der letzte Term in Formel (4.6) ist falsch. Korrekt muß es heißen:
=
=22 )()(
))((
yyxx
yyxx
ss
s
r
ii
ii
yx
xy
Kapitel 5, Seite 118:
Die Formel (5.30) müßte richtig lauten: 0)(Var
=
b.
Kapitel 9, Seite 224 – Wilcoxon-Test für eine Stichprobe:
Ganz oben: Nicht die Meßwerte i
x werden nach ihrer Größe sortiert, sondern die Dif-
ferenzbeträge || 0
µ
i
x. Dieser Test funktioniert ähnlich wie der Wilcoxon-Test für 2
verbundene Stichproben; siehe Beispiel 9.5 auf Seite 226.
Kapitel 11, Seite 266 – Zufällige Fehler:
Im Abschnitt 10.4.2 wurden die Begriffe intraindividuell und interindividuell vertauscht.
Die intraindividuelle Variabilität bezieht sich auf eine einzelne Beobachtungseinheit,
bei der sich beim Messen einer Größe unterschiedliche Werte ergeben, die
interindividuelle Variabilität bezieht sich auf mehrere Beobachtungseinheiten, bei
denen man unterschiedliche Ergebnisse erhält.