Fragenkatalog zum Lehrbuch "Basiswissenschaften in medizinischer Statistik"
Vorwort
Vorwort
Im Folgenden werden einige Aufgaben zum Lehrbuch dargestellt:
Grundkenntnisse Medizinische Kenntnisse
Statistiken
(aufgenommen)
Springer-Verlag, April 1999) zusammen mit
Der Leser soll damit die Möglichkeiten nutzen,
Ich möchte Ihnen mitteilen, wie
Er kann (oder sie kann)
Sie wissen, daß
Das erworbene Wissen ist keineswegs nur theoretisch.
Ich möchte Ihnen sagen, daß es sich bei praktischen Fragen um
Die Schriftstellerin bietet sich
Die
legen
Das Buch enthält eine Reihe von wichtigen Zusammenfassungen.
Besonderheiten, Besonderheiten,
Die Aufgaben sind wie bei einem Biomathe-Klausul gestaltet: es werden 5 Antworten geben, von denen genau eine richtig ist. Je nach Kapitel 2 bis 11 werden jeweils 10 bis 15 Aufgaben aufgelistet, anschließend (farbig hervorgehoben) die entsprechenden Lösungen. Obwohl es nicht garantiert werden kann, dass ein Student, nachdem er die Aufgaben gelöst und die Klausur richtig verstanden hat, mit Bravour besteht er hat jedoch sicherlich eine gute Ausgangsposition. Aufgaben, die über den Inhalt des Gegenstands des Katalogs hinausgehen und daher für die Klausur relevant sind, sind mit einem kleinen Sternzeichen gekennzeichnet.
Die Aufgaben wurden inzwischen von zahlreichen Studenten der Klinik Mannheim
Überarbeitet und kommentiert; ihre Verbesserungsvorschläge wurden selbstständig veröffentlicht.
Es gibt eine Reihe von Aufgaben, die man immer gerne übernimmt.
Abschnitt
Errata
Ich bin übrigens jederzeit dankbar für Hinweise, Kritik und Verbesserungsvorschläge. Sie können mich über meine Dienststelle (Klinikum Mannheim, ZMF, 68135 Mannheim) oder per E-Mail ( [email protected] Mannheim, August 1999 Christel Weiß 1 Inhaltsliste Inhaltsliste der Aufgabenseiten Teil I: Beschreibende Statistiken ...
Theoretische Grundlagen
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Einheitliche Datenbeschreibung
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Bivariate Datenbeschreibung
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Teil II:
Wahrscheinlichkeitsrechnung
Grundlagen der Wahrscheinlichkeitsrechnung 5.1 Aufgaben
5.2.
Lösungen
Spezielle Wahrscheinlichkeiten in der Medizin 6.1 Aufgaben
6.2
Lösungen
Einige theoretische Verteilungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.2
Lösungen
Teil III: Induktive Statistiken Schätzungsverfahren
8.1
Aufgaben
8.2 Lösungen für statistische Tests
9.1
Aufgaben
9.2 Lösungen: Teil IV: Versuchsplanung
Grundlagen der Versuchsplanung
10.1 Aufgaben 10.2 Lösungen
Studientypen
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Errata im Buch
2 Theoretische Grundlagen Teil I: Beschreibende Statistik Theoretische Grundlagen Aufgabe 2.1: Beobachtungseinheiten Bei 50 erstgeborenen Frauen wird die Wirksamkeit eines Arzneimittels untersucht, das bei Schmerzschwäche den Mutterleib öffnen soll.
Alternatives Merkmal
Qualitativ, nur nominell skaliert
Qualitativ, ordinales Skaliert
quantitativer, diskreter
quantitativer, stetig
Aufgabe 2.3:
Einfluß- und Zielgrößen
In einer gynäkologischen Klinik wird untersucht, wie sich Rauchgewohnheiten
Schwangere Frauen beeinflussen das Geburtsgewicht ihrer Kinder.
die durchschnittliche Anzahl der Zigaretten, die die Mutter pro Tag raucht,
das Geburtsgewicht des Kindes,
das Alter der Mutter,
das Körpergewicht der Mutter vor der Schwangerschaft
Wie sind die Merkmale zu ordnen? Anzahl der täglich gerauchte Zigaretten Alter der Mutter a Faktor Gewicht der Mutter vor der Schwangerschaft psychische oder soziale Belastungen der Mutter b Begleitmerkmal c Größe der Ernährung der Mutter d Zielgewicht des Kindes 2 Theoretische Grundlagen 1a, 2b, 3b, 4c, 5c, 6d 1a, 2a, 3a, 4c, 5c, 6d 1c, 2a, 3a, 4c, 5b, 6d 1a, 2b, 3b, 4a, 5a, 6d 1a, 2a, 3a, 6a, 4a, 4a, 6d 1a, 3a, 4a, 4a, 6a, 4c, 6a, 6a, 2a, 4c, 6a:
Spezifisches Gewicht
Nominalskala
Reduzierungsgeschwindigkeit
Ordinalskala
Anzahl der Thrombozyten pro
Intervallskala
Blutgruppe
Verhältnismäßige Skala
Temperatur in Grad Celsius
1d, 2d, 3d, 4a, 5d
1d, 2d, 3d, 4a, 5c
1d, 2c, 3b, 4a, 5a
1d, 2d, 3c, 4b, 5c
1c, 2c, 3b, 4c, 5a
Aufgabe 2.5:
Diskrete und stetige Merkmale des Blutes
Welche der folgenden Merkmale sind diskret ? pH-Wert Rhesusfaktor Blutgruppe Hämatokrit Anzahl der Leukozyten pro L Blut Leukämie (mit den Ausdrücken Ja/Nein) kein Merkmal ist diskret Alle Merkmale sind diskret nur 2 und 3 sind diskret nur 2, 3, 5 und 6 sind diskret Alle außer 4 sind diskret Aufgabe 2.6: Eigenschaften stetiger Merkmale Beurteilen Sie die folgende Aussage:
2 Theoretische Grundlagen
Aussage 1
Aussage 2
Verknüpfung
Richtig
Richtig
Richtig
Richtig
Richtig
falsch
Richtig
falsch
falsch
Richtig
falsch
falsch
Aufgabe 2.7:
Skalierungstransformationen allgemein
Welche Aussage stimmt? Eine Ordinalskala kann auf eine Intervallskala umgewandelt werden, wenn alle Ausdrücke numerisch kodiert sind. Ein Qualitätsmerkmal mit sehr vielen Ausdrücken kann als stetig angesehen werden. Die Transformation auf eine andere Skala-Ebene ist im Allgemeinen nicht möglich.
Die Transformation auf eine andere Ebene ist immer möglich, aber nie
Siehe
Eine Relativitätsskala kann auf eine Ordinalskala umgewandelt werden. Aufgabe 2.8: Schaltransformation beim Proteingehalt Der Proteingehalt im Urin kann genau in mg/dl gemessen werden. Bei einer Routineuntersuchung werden Teststreifen verwendet, mit denen nur festgestellt werden kann, ob der Proteingehalt im pathologischen Bereich liegt.
In der Theorie wird eine Reduktion von einer metrischen Skala auf eine Nominalskala
Der Proteingehalt wird bei dieser Messmethode als alternatives Merkmal betrachtet. Die Messmethode ist in jedem Fall sinnlos, da sehr viel Information verloren geht.
Die Ergebnisse dieses Messverfahrens ermöglichen weniger differenzierte Auswertungen.
Bewertungen als die genauen Messwerte in mg/dl. Aufgabe 2.9: Ausdrucksliste mit Laborwerten In einer Klinik werden in Patienten, die geplant operiert werden, preoperativ La-Borwerte erfasst und in einem EDV-System dokumentiert wie folgt: es gibt keine Laborwerte vor allen Werten normal sind Blutwerte pathologisch Schrumpfwerte pathologisch Säure-Basis-Haushalt pathologisch andere Werte pathologisch 2 Theoretische Grundlagen Wenn mehrere Ausdrucksliste zutreffen, wird die Summe notiert. Diese Ausdrucksliste ist: Unzulässig, da qualitative Merkmale nicht numerisch kodiert werden dürfen, entweder vollständig abgeschnitten oder vollständig abgeschnitten, aber nicht vollständig, aber nicht vollständig abgeschnitten Aufgabe:
Diese Codierung ist zu grob für praktische Untersuchungen und ist daher unmöglich.
2 Theoretische Grundlagen Aufgabe 2.1: Beobachtungseinheiten Lösung: (die Frauen, die das Medikament erhalten) Beobachtungseinheiten sind die Personen oder Objekte, die beobachtet werden (d. h. die 50 Frauen; sie bilden die Stichprobe) und nicht die Personen, die beobachten (d. h. die Krankenschwestern oder Ärzte, Antworten A und C sind halb falsch).
Aufgabe 2.2:
Eigenschaften
ASA-Gruppe
Lösung:
(qualitativ, ordinales)
Die Ausdrücke von ASA I bis ASA V können sinnvoll in einer Reihenfolge angeordnet werden; daher ist dieses Merkmal ordinalskaliert. Es hat 5 Ausdrücke und ist also kein alternatives Merkmal (das hat nur 2 Ausdrücke gegeben). Antwort A ist daher falsch. Da die Ordinalskala ein höheres Niveau hat als die Nominalskala, ist auch die Antwort B falsch. Das ASA Merkmal ist zwar diskret, aber nicht quantitativ (der Abstand zwischen 2 Ausdrücken ist nicht definiert). Daher sind die Antworten D und (erst richtig) E falsch.
Aufgabe 2.3:
Einfluß- und Zielgrößen
Lösung:
Es wird den Einfluss von Zigarettenkonsum auf das Geburtsgewicht der Babys beeinträchtigen.
so ist Merkmal 1 (Zigarettenzahl) ein Faktor und Merkmal 6 (Geburtsgewicht) eine Zielgröße (1a und 6d). Das Geburtsgewicht des Kindes vor der Schwangerschaft kann sich auch auf das Alter der Mutter und deren Gewicht vor der Schwangerschaft auswirken da diese beiden Merkmale zwar berücksichtigt werden, aber nicht ausgewertet werden, es handelt sich um Begleitmerkmale (2b und 3b). Merkmale 4 und 5 (Mother's Belastung und Ernährung) beeinflussen auch die Zielgröße; sie werden hier jedoch nicht berücksichtigt und daher als unverzerrliche Störgrößen (4c und 5c) eingestuft.
Aufgabe 2.4:
Charakteristika des Blutes und ihre Skalenebenen
Lösung:
Die ersten drei Merkmale sind
Es ist relativ skalierbar (1d, 2d, 3d);
Schlagzeilen
Gen einer Marke
Das ist der Fall, wenn man in einem Verhältnis von etwa 100 000
Trombozyten
pro Jahr
Das Blut ist doppelt so viel wie 50.000.
nominell vergrößert
(4a) Die Temperatur in
Celius-Grade ist zwar quantitativ, aber nur
Intervallskaliert
Das Merkmal Anzahl der Leukozyten pro Blut hat zwar sehr viele Ausdrücke, aber nur ganzheitlich und ist daher auch diskret. Die beiden anderen Merkmale (PH-Wert, Hämatocrit) können innerhalb eines bestimmten Bereichs einen Wert annehmen und sind daher quantitativ stetig.
Aufgabe 2.6:
Eigenschaften von stetigen Merkmalen
Lösung:
(beide Aussagen richtig, Verbindung falsch)
Der
Glucose-Gehalt ist ein
Es handelt sich hierbei um eine quantitativ stetige Eigenschaft (d. h. nicht qualitativ).
Die Tatsache, dass ein Merkmal nicht qualitativ (d. h. quantitativ) ist, bedeutet nicht automatisch, dass es auch stetig ist. Es gibt auch quantitativ diskrete Merkmale (z. B. die Leukozytenzahl pro Blut).
Aufgabe 2.7:
Skalierungstransformationen allgemein
Lösung:
(Verhältnismäßige Skala)
Ordinalskala)
Im Allgemeinen kann eine Skala nur auf eine andere Skala mit einem niedrigeren Niveau transformiert werden. Daher sind die Antworten A und C falsch, und Antwort E ist richtig (die Ordinalskala hat ein niedrigeres Niveau als die Verhältnisskala). Ein stetiges Merkmal setzt quantitative Daten voraus; also ist Antwort B falsch. Antwort D ist ebenfalls falsch: Die Transformation ist nicht immer möglich (eine Nominalskala kann nicht transformiert werden). Ob eine Transformation sinnvoll ist, hängt von den speziellen Rahmenbedingungen ab (siehe auch Seite 25 oben im Buch).
Aufgabe 2.8:
Schaltransformation beim Proteingehalt
Lösung:
(die Aussage ist zutreffend)
nicht
zu)
Aufmerksamkeit!
falsch
Das ist etwas verwirrend, aber
Solche Aufgaben finden sich ab und zu in Klausuren. Wenn man das Protein in mg/dl misst, hat man ein verhältnismäßiges Merkmal. Wenn man es nur mit den Ausdrücken pathologisch (ja/nein) betrachtet, hat man ein alternes Merkmal (d. h. ein no-minalskaliertes). Die Antworten A und B sind also richtig. Auch die Aussage D ist leicht nachvollziehbar. Da bei der einfachen Messmethode sehr viel Information verloren geht, kann man die Daten natürlich auch nicht so gut analysieren deshalb ist die Antwort E korrekt.
Aufgabe 2.9:
Ausdrucksliste mit Laborwerten
Lösung:
(vollständig, aber nicht disjunkt)
Die Antwort A ist natürlich sinnlos, denn selbstverständlich ist d
Qualitätsmerkmale
Name
Sie sind in der Lage, die Daten zu erfassen, um die Daten zu erfassen.
Ausdrucksliste vollständig und
ist disjunkt).
Es ist klar, dass die Liste vollständig ist; aufgrund der Angabe 5 (andere path. Werte) kann alles erfasst werden. Sie ist aber nicht disjunkt, weil zwei Ausdrücke nicht unbestimmt unterscheidbar sind. So kann z.B. die Codierung 5 bedeuten: Blutwerte und Vermögenswerte pathologisch oder andere Werte pathologisch. Dieses Problem kann umgangen werden, indem man statt der Zahlen 16 die 2 Potenzen 1, 2, 4, 8 usw. zur Koordination verwendet.
Aufgabe 2.10:
Ausdrucksliste mit
Klassifizierte Daten
Lösung:
(vollständig, aber nicht disjunkt)
Die Aussage A ist nicht so allgemein zutreffend. Ob diese ungenaue Erfassung nützlich ist oder nicht, hängt von der speziellen Frage ab. Die Liste ist vollständig, denn mit den Codes 0 und 6 können auch die extremsten Körpergrößen erfasst werden.
Sie ist jedoch nicht
bei den Körpergrößen 150 cm, 160 cm usw.
Die Codierungen schließen sich nicht einander an.
Bei allen Klassenabteilungen muss die
Halbverfolgung der Messwerte,
Univariate Datenbeschreibung Univariate Datenbeschreibung Aufgabe 3.1: Balkendiagramm Mit einem Balkendiagramm können Frequenzen graphisch dargestellt werden. Für welche Merkmale ist diese Darstellung geeignet?
allgemein für alle Merkmale
für alle diskreten Merkmale und für stetige Merkmale, wenn die Daten in Klassen eingeteilt sind, nur für nominale Merkmale, nur für qualitative Merkmale für alle diskreten Merkmale Aufgabe 3.2: Relative Häufigkeit Darstellung In einer klinischen Studie wird die Wirksamkeit einer therapeutischen Maßnahme in 22 Patienten untersucht.
Welche Darstellung der entsprechenden relativen Häufigkeit ist am sinnvollsten? ist über 50 %. liegt zwischen 60 % und 70 %. Aufgabe 3.3: Relative Häufigkeit Blutdruck In einer Probe von Personen werden die in der Tabelle aufgeführten Blutdruckwerte (in mmHg) gemessen.
Diastolischer
systolischer Blutdruck
Blutdruck
Gesamtbetrag
Gesamtbetrag
Hypertonie ist vorhanden, wenn
systolischer Blutdruck mehr als 150
mmHg oder der
Diastole mehr als 100
Wie groß ist dann die relative Häufigkeit der
Einheitliche Datenbeschreibung 15/200 15/38 15/16 54/200 39/200 Aufgabe 3.4: Klassenordnung allgemein Welche Aussage über klassifizierte Daten ist falsch Klassenbildung setzt ein quantitatives Merkmal voraus.
Die optimale Anzahl der Klassen hängt von der Anzahl der Proben ab. Durch die Klassenbildung werden Informationen verloren, um die Frequenzverteilung deutlicher darzustellen. Die Klassen müssen immer gleich breit sein. Auf einem Histogramm sind charakteristische Eigenschaften der Eigenschaftsverteilung (Legie, Verteilung, Verteilung) erkennbar.
Aufgabe 3.5:*
Klassenordnung Berechnung des Durchschnittswerts
Die Körpergröße-Daten von 50 männlichen Studenten sind in den folgenden Klassen angegeben:
aufgeteilt:
Klasse
Grenzen
absolute Frequenzen
in cm,
in cm,
Welche Aussage bezüglich des Durchschnittswertes ist zutreffend? Man kann aus diesen Angaben einen Durchschnittswert ermitteln und dabei genau den gleichen Wert erhalten wie aus den nicht klassifizierten ursprünglichen Messwerten. Man kann aus diesen Angaben einen Durchschnittswert berechnen, der jedoch mit einer Ungenauigkeit belegt ist.
Die Berechnung eines Durchschnittswertes ist aufgrund der offenen Restklassen nicht möglich.
Ein Mittelwert kann nicht berechnet werden, da die Klassen unterschiedlich breit sind. Univariate Datenbeschreibung Aufgabe 3.6: Empirische Verteilungsfunktion allgemein Welche Aussage bezüglich der empirischen Verteilungsfunktion falsch ist, ist für alle definiert.
Zwischen dem Kleinsten und dem Größten
Stichprobenwert wächst
Monotone
Ein Funktionswert gibt den relativen Anteil der Beobachtungen an, die kleiner oder gleich sind. Ein Funktionswert gibt den relativen Anteil der Beobachtungen an, die größer oder gleich sind.
Das ist das empirisch ermittelte Unterquartier, das empirisch ermittelte Oberquartier, dem keiner dieser Eigenschaften zugeschrieben werden kann. Bei klassifizierten Daten kann die Verteilungsfunktion nicht bestimmt werden. Aufgabe 3.8: Vergleich von Mittelwert und Median Welche der folgenden Aussagen ist falsch.
Die Berechnung des Durchschnittswertes setzt ein quantitatives Merkmal voraus. Der Durchschnittswert und der Median sind Lagemessen. Wenn der Median wesentlich größer ist als der Durchschnittswert, ist die Verteilung falsch. Wenn die Berechnung des Medians erlaubt ist, kann auch der Durchschnittswert berechnet werden.
Aufgabe 3.9:
Bestimmung der empirischen
Medien
69 Studenten schreiben eine Klausur, bei der maximal 10 Punkte erreicht werden können. Der Klau sur wird als bestanden angesehen, wenn mindestens 5 Punkte erreicht werden. Es entsteht folgende Frequenztabelle: Anzahl der Punkte Häufigkeit Univariate Datenbeschreibung Der empirische Median ist: 6,5 nicht bestimmbare Aufgabe 3.10: Eigenschaften des Medians Welche Aussage ist richtig? In jedem Fall bleibt der Median unverändert, wenn alle Werte außerhalb des Intervalls der Stichprobe zum größten Wert gezogen werden, wenn eine positive Zahl hinzugefügt wird, werden alle Werte mit derselben Zahl multipliziert werden zu allen Werten eine Konstante hinzugefügt wird, wenn ein Auslöser weggelassen wird Aufgabe 3.11:
Aufgabe 3.12:
Größenzahlen für die
ASA-Risikogruppe
Jeder Patient, der sich in der Klinik M.
Siehe, siehe, siehe, siehe, siehe, siehe, siehe, siehe, siehe, siehe, siehe, siehe, siehe, siehe, siehe, siehe, siehe, siehe, siehe, siehe, siehe, siehe, siehe, siehe, siehe, siehe, siehe, siehe, siehe, siehe, siehe, siehe, siehe, siehe, siehe, siehe, siehe, siehe,
Die
Risiken nach ASA I (niedriges Risiko) bis ASA V (sehr hoch)
Durchschnittswert Varianz Median Standard Abweichung Modus Spannungsdauer Univariate Datenbeschreibung Alle angegebenen Messzahlen können nur a, d und e berechnet werden nur c nur b, c und f nur a und b Aufgabe 3.13: Messzahlen für die Aufenthaltsdauer Bei jedem Patienten, der mit einer bestimmten Diagnose in eine Klinik eingeladen wird, wird die Aufenthaltsdauer (in Tagen) ermittelt.
Durchschnittswert
Standard Abweichung
Median
Veränderungskoeffizient
Modus
Spannweite
Alle angegebenen Messzahlen können berechnet werden
nur a und d
nur a, d und e
nur c und f
nur a, b und d
Aufgabe 3.14:
Messzahlen und
Umfang der Stichproben
Aus einer Umfangsprobe
Es wird für ein quantitatives Merkmal ermittelt.
Der durchschnittliche Wert, der
Median, Spannweite und Variabilität.
Es gibt noch 10 weitere Beobachtungseinheiten, die in derselben Grundeinheit eingesetzt werden.
Es ist nicht unerläßlich, daß die
gegebenen Messzahlen aus der größeren Umfangsprobe
- Was ?
Durchschnittswert Median Spannweite Summe der Quadrate der Abweichungen vom Durchschnittswert (Varienzzähler) Variation keine der Messwerte 15 kann kleiner werden nur 3 und 4 können nicht kleiner werden nur 3, 4 und 5 können nicht kleiner werden alle Messwerte können kleiner werden
Aufgabe 3.2:
Relative Häufigkeit Darstellung
Lösung:
(Ausschuss vom 14. bis 22. Dezember)
Es kann für einige Leser schwierig sein, die richtige Lösung anzugeben, denn
Bei 22 Beobachtungsstufen würde man mit einem Prozentsatz oder einer Frequenz von 4 Dezipunkten eine Genauigkeit vorstellen, die nicht vorhanden ist. Daher sind die Antworten A und B nicht sinnvoll. Die Antworten D und E sind zwar richtig, aber zu ungenau. Die Angabe C ist dagegen genau und verbirgt nicht, dass die Berechnung der Frequenz auf einer relativ kleinen Anzahl von Beobachtungen basiert.
Aufgabe 3.3:
Relative Hä
Blutgruppe
Lösung:
(39/200)
Das Wort
oder
wird in statistischen Berechnungen (und in der Mathematik) allgemein angewandt.
in der
Die 39 Patienten mit
Hypertonie teilen
Es wurde in 23 Patienten untersucht (
Stytholische
Blutdruck > 150
mmHg,
Diastolischer normaler,
Ein Patient (
Diastolisches Blut
Druck > 100
mmHg,
Schwerpunkte sind:
Tient (diastolischer Blutdruck > 100 mgHg)
und
Stytholische > 150
Es ist notwendig,
Allerdings ist darauf zu achten, dass die 15 Patienten, die beide Kriterien für Hypertonie erfüllen, nicht doppelt gezählt werden so wurde das falsche Ergebnis in der Antwort auf Frage D. Aufgabe 3.4 erhalten: Klassenverteilung allgemeine Lösung: (Satz ist falsch Vorsicht: hier wird eine falsche Aussage gefragt und dies ist Aussage D. Es ist zwar mathematisch günstig und klar, wenn die Klassen gleich breit sind aber dies ist keine unerlässliche Voraussetzung für eine Klassenverteilung. Manchmal (zum Beispiel bei Auslösern oder bei Klassen, die nicht genau definiert sind) werden auch einheitliche Datenbeschreibung einer Randgrenze verwendet. Die Aussage A (bei richtigen Daten ist die Offenheit von Klassen genauso gut wie die Klassenverteilung) ist zwar mathematisch günstig, aber es ist keine unerlässliche Voraussetzung für eine Klassenverteilung.
Aufgabe 3.5:*
Klassenabteilung Berechnung der
Durchschnittswerte
Lösung:
(Es ist nicht möglich, den Durchschnittswert zu berechnen)
Die Berechnung eines Durchschnittswertes (sowie der Variante) bei
Es ist möglich, die Daten zu klassifizieren.
Es ist auch nicht sinnvoll, irgendwelche Klassenmitten der offenen Restklassen zu erfassen (dazu D falsch ist). Nur bei abgeschlossenen Klassen ist eine Schätzung des Durchschnittswertes aus den Klassenmitten möglich (auch wenn diese unterschiedlich breit sind, ist E falsch). Dieser Wert wäre jedoch etwas ungenau (d. h.
Wenn keine offenen Restklassen vorliegen, wäre B die richtige Antwort). Aufgabe 3.6: Empirische Verteilungsfunktion Allgemeine Lösung: (Aussage ist falsch Die Aussagen A, B und E folgen sofort der Definition nach Formel (3.7) (Seite 36, diskrete Merkmale) bzw. nach Formel (3.9) (Seite 41, stetige Merkmale male). Nach der Definition der empirischen Verteilungsfunktion ist auch Antwort C richtig, Aussage D muss dann falsch sein.
Aufgabe 3.7:
Empirische Verteilungsfunktion bei
Klassifizierte Daten
Lösung:
ist unterhalb des Quartiers)
Offensichtliche Unsinn ist die Antwort E.
Klassifiziert
Daten und Verteilungsfunktionen
Sie sind in der Regel nicht in der Lage, sich in der Lage zu bewegen.
Seite 41 des Buches. Diese Funktion gibt keine relativen Frequenzen an (so ist auch Antwort A falsch), sondern kumulative (sondern addierte) Frequenzen. Wenn also: , bedeutet dies, dass 25% der Stichprobenwerte kleiner oder gleich sind also ist das untere Quartel (Antwort B). Für das obere Quartel (Antwort C) gilt: "Empirisch zählt er mit" bedeutet hier: Der Quartel wird durch Stichprobenwerte bestimmt.
Einheitliche Datenbeschreibung
Aufgabe 3.8:
Vergleichswert und
Median
Lösung:
(Die Aussage ist:
falsch
Die Mittel
Der Wert wird stark von Auslösern beeinflusst, während Auslöser bei der
Berechnung der
Medien
Sie spielen kaum eine Rolle (siehe vgl. 3.10, Seite 48); Antwort A
Das ist also richtig.
die titative Merkmale des Durchschnittswertes und der
Wenn diese beiden Messungen stark unterschiedlich sind, ist die Verteilung falsch (Antwort D). Bei ordinalkalierten Merkmalen kann der Median berechnet werden, der Durchschnitt dagegen nicht. Daher ist die Antwort E falsch. Achtung: Bei ordinalkalierten Daten wird oft der Durchschnitt falsch angegeben z.B. bei Schulnoten. Dann werden von den Daten Informationen ausgewertet, die diese überhaupt nicht enthalten.
Aufgabe 3.9:
Bestimmung der empirischen
Medien
Lösung:
(Median ist 6)
Der
Die Stichprobengröße ist
Mit der Formel (3.15) ergeben sich
Die
Median
Die
Der Stichprobenwert mit Rang 35; das ist 6. Entscheidend ist also nur
Der durchschnittliche Wert konnte nicht aus diesen Angaben berechnet werden,
Das ist es.
alle
Die Frequenztabelle zeigt jedoch, dass
Problem 3.10: Eigenschaften des Medians Lösung: (zum größten Wert kann man eine Zahl addieren) Wenn man zum größten Wert eine positive Zahl addiert, bleibt dies der größte Wert.
Dies hat jedoch keinen Einfluss auf die
Median; deshalb ist B richtig.
ein oder mehrere Werte aus der Stichprobe entnehmen
Wenn sich der Umfang ändert, und
Es ist möglich, daß auch die
Median (die Antworten A und E sind daher falsch).
Wenn alle Werte mit derselben Zahl multipliziert oder eine Zahl zu allen Werten hinzugefügt wird, ändert sich der Median in derselben Weise (obwohl sein Rang unverändert bleibt). Daher sind auch die Antworten C und D falsch. Aufgabe 3.11: Lage- und Verstreuungsmessungen Lösung: (5 Verstreuungsmessungen) Verstreuungsmessungen sind: die Variation, die Spannweite, der Variationskoeffizient, der Quartierentstand und die Standardabweichung sie beschreiben die Variabilität einer Stichprobe.
Einheitliche Datenbeschreibung
Aufgabe 3.12:
Größenzahlen für die
ASA-Risikogruppe
Lösung:
(Median, Modus und Bandbreite)
Es handelt sich hierbei um die
ASA-Risikogruppe um
Ordnungsgemäß eingeschaltetes Merkmal (siehe
Aufgabe 2.2, Seite 1). Bei diesem Merkmal können nur die
Median
Ob diese Angaben immer sinnvoll sind, ist eine andere Frage. Oft werden bei metrischen Merkmalen nur der Durchschnittswert und die Standardabweichung angegeben; bei den anderen Merkmalen werden nur der Durchschnittswert und die Standardabweichung angegeben; bei besonderen Feststellungen werden die anderen Merkmale berücksichtigt.
Aufgabe 3.14:
Messzahlen und
Umfang der Stichproben
Lösung:
(Spannweite und Summe der Abweichungsquadrate)
Es ist klar, daß eine größere Stichprobe bessere Schätzungen ermöglicht als eine größere Stichprobe.
Das bedeutet, dass die Messwerte durchschnittlich
Median und Varianz liegen
Wartungsgemäß
Näher
Wenn die neuen 10 Bewertungsbereiche ein höheres Maximum (oder ein geringeres Minimum) haben als die ersten 10, wächst die Spannungsbreite sonst bleibt sie gleich. Da Abweichungsquadrate nie negativ sind, kann die Summe nicht auch durch eine Erhöhung des Stichprobenumfangs verkleinert werden höchstens die Variation, bei der sie durch den Nenner dividiert wird.
Bivariate Datenbeschreibung
Bivariate Datenbeschreibung
Aufgabe 4.1:
Punktwolke
Die Beziehung zwischen zwei metrischen Merkmalen lässt sich durch eine Punktwolke
Die Daten, die sich auf die Daten erstrecken, können physisch dargestellt werden.
nicht
ob der Zusammenhang annähernd linear ist, ob Auslöser vorhanden sind, ob der Zusammenhang stark oder eher schwach ist, ob der Zusammenhang gleich oder widersprüchlich ist, ob die beiden Merkmale in einem kausalen Zusammenhang stehen, Frage 4.2: Kovarianz
Bei 2 Merkmalen mit einem beliebigen Maßstab
Beide Merkmale müssen verhältnismäßig skaliert sein. Es genügt, wenn beide Merkmale ordinal skaliert sind. Es genügt, wenn mindestens 1 Merkmal metrisch skaliert ist. Beide Merkmale müssen metrisch skaliert sein.
Aufgabe 4.4:
Interpretation eines
Korrelationskoeffizienten
Welche empirische
Korrelationskoeffizient nach
Pearson bezeichnete die stärkste
Beivariable Datenbeschreibung Aufgabe 4.5: Definitionsbereich Welches Intervall umfasst alle Zahlenwerte, die das Definitionsniveau annehmen kann?
Aufgabe 4.6:
Regressionsliste
Eine
Die Regressionsstraße hat die Form:
. Was folgt für die
Problem 4.7: Regressionskoeffizient Der Regressionskoeffizient ist die Steigerung der Regressionsreihen der Schwerpunktwolke des Punktpunkts des Schnittpunkts der Regressionsreihen mit der Achse immer eine Zahl zwischen 0 und 1 ein Punkt auf der Regressionsreihen Aufgabe 4.8: Korrelationskoeffizient und Regressionsreihen sind ein Korrelationskoeffizient. Was folgt daraus für die Regressionsreihen?
Die Steigung der Regressionsleitungen ist positiv. Die Steigung der Regressionsleitungen ist negativ. Die Steigung der Regressionsleitungen beträgt 0.2. Der Achsenbereich beträgt 0.2. Da der Zusammenhang sehr schwach ist, ist die Darstellung durch eine Regressionsleitung nicht zulässig.
Bivariate Datenbeschreibung
Aufgabe 4.9:
Vergleich z
Messverfahren
Eine neue Messmethode
wird mit einer
Referenzmethode
Vergleichen.
die Qualität der neuen Methode durch die Regressionskoeffizienten durch die Korrelationskoeffizienten durch die Bestimmung durch die Regressionskoeffizienten und die Korrelationskoeffizienten durch den Schwerpunkt der Punktwolke Aufgabe 4.10: Prognostizieren mit der Regressionskoeffizienten Ein Patient mit Bluthochdruck erhält eine Therapie über 15 Tage, die danach abgebrochen wird.
Während der Therapie sinkt der Blutdruck durchschnittlich um 0,89
mmHg pro
Tag. Der Blutdruck sinkt während der Therapie durchschnittlich um 4 mmHg pro Tag. Die Schätzung für den letzten Tag der Therapie beträgt 120 mmHg. Zu Beginn der Therapie hatte der Patient einen Blutdruck von etwa 180 mmHg. Am 20. Tag nach Beginn der Therapie kann der Patient einen Blutdruck von 100 mmHg erwarten.
Nur Aussage 2 ist nachvollziehbar
Nur Aussage 1 ist nachvollziehbar
Nur die Aussagen 2, 3 und 4 sind abgeleitet.
die Aussagen 2, 3, 4 und 5 sind abgeleitet
die Aussagen 1, 3, 4 und 5 sind abgeleitet
Aufgabe 4.11:
Geeignete Zusammenhänge
Von zwei Metern
Es ist nur bekannt, dass die Beziehung zwischen
Ton stei
Welche Maßnahme ist für die
Das Ziel ist es, die Stärke dieser
Zusammenhänge? die Kovarianz des Korrelationskoeffizients nach Pearson der Korrelationskoeffizient nach Spearman das Produkt der beiden Standardabweichungen keine der Angaben aus AD Bivariate Datenbeschreibung Aufgabe 4.12: Wertebereiche Wie viele der folgenden 10 Messzahlen können nie negative Werte annehmen?
Spannweite Variation Standard Abweichung Minimum Maximum Modus
Median
Korrelationskoeffizient
Kovarianz
Bestimmungsmaß
Alle 10
Nur 7
Nur 5
Nur 4
Nur zwei
Aufgabe 4.13:
Zusammenhang zwischen Körpergröße und Gewicht
Beurteilen Sie die folgenden Aussagen:
Der
Korrelationskoeffizient, der den Zusammenhang zwischen Körpergröße und
Das Körpergewicht von männlichen Erwachsenen ist positiv, denn
Diese beiden Merkmale können nur positive Werte annehmen. Aussage 1 Aussage 2 Verknüpfung richtig richtig richtig richtig falsch falsch falsch falsch falsch falsch falsch falsch falsch Aufgabe 4.14: Abhängig und unabhängig Merkmal Der Zusammenhang zwischen Körpergröße und Gewicht bei erwachsenen Frauen im Alter von 20 bis 40 Jahren soll durch eine Regressionsgleichung beschrieben werden.
Welches Merkmal sollte vernünftigerweise als die unabhängige
-Welches Merkmal und welches
als die abhängige
Diese Beziehung kann nicht durch eine Regressionsgleichung beschrieben werden. Es ist völlig unwichtig, welches der beiden Merkmale als abhängig oder unabhängig angesehen wird.
Die Größe sollte als die unabhängige
-Kennzeichen gewählt werden. Man berechnet 2 Mal die Korrelationskoeffizienten (einmal mit der Größe und einmal mit dem Gewicht als unabhängiges Merkmal). Der größere Koeffizient liefert die Entscheidung. Bivariate Datenbeschreibung Aufgabe 4.1: Punktwolkenlösung: (kausaler Zusammenhang nicht erkennbar) Die Darstellung von 2 Merkmalen durch eine Punktwolke liefert sehr wertvolle Informationen (Antworten AD). Man sieht, ob die Punkte um jede Linie liegen (wenn die Zusammenhängung nahezu linear ist, ist die Antwort A). Auslöser sind auf einen Blick erkennbar (B).
Der Zusammenhang ist sachlich begründet und verursacht, oder ob es sich um eine
Unsinn.
Korrelation. Aufgabe 4.2: Kovarianz Lösung: (beide Merkmale metrisch) Die Berechnung der Kovarianz basiert auf den Mittelwerten und (siehe Formel 4.4, Seite 74).
Aufgabe 4.3:
Der Wertbereich der
Korrelationskoeffizienten
Lösung:
Das ist ja gerade die herausragende Eigenschaft des
Korrelationskoeffizienten, die
Die Grenzen sind eingeschlossen, wenn die Kohärenz funktional ist und exakt durch eine gerade Gleichung beschrieben werden kann (was praktisch kaum vorkommt, aber theoretisch möglich ist), beträgt der Korrelationskoeffizient oder. Bei stochastischen Zusammenhängen hat er einen Betrag, der kleiner als 1 ist.
Aufgabe 4.4:
Interpretation eines
Korrelationskoeffizienten
Lösung:
Es ist durchaus absurd, dass die Aussage E: dieses Maß ist sehr gut geeignet, um eine lineare Zusammenhängung zu beschreiben. Auch die Aussage D ist sofort als falsch bezeichnet: Bivariate Datenbeschreibung kann nur Werte annehmen, deren Wert höchstens 1 ist. Nun ist bekannt, dass, je näher der Betrag von 1 ist, desto stärker der Zusammenhang ist. Daher ist eine Zusammenhängung mit einer stärker als eine mit (in Bezug auf die Stärke spielt das Vorzeichen keine Rolle). Die Antwort A () bezieht sich auf 2 Merkmale, bei denen kein linearer Zusammenhang überhaupt erkennbar ist.
Aufgabe 4.5:
Der Wertbereich der
Bestimmungsmaß
Lösung:
Es ist notwendig zu wissen, daß die
Bestimmtheit durch
wird quantifiziert (Formel
Auf der Seite 88.
zwischen 1 und +1, hat
Einer
Wertbereich
Problem 4.6: Regressionsreihe-Lösung: Wenn die Steigung der Regressionsreihe wie hier mit 0,3 positiv ist, ist die Zusammenhänge gleich sinnvoll (Antwort A falsch, B richtig) Weitergehende Aussagen sind nicht möglich. Man weiß also nur, dass der Korrelationskoeffizient positiv ist; die Gleiche der Regressionsreihe enthält keine Aussagen über seinen Betrag.
Aufgabe 4.7:
Regressionskoeffizient
Lösung:
(Rückläufige Linien steigen)
Dies ist nur eine Frage der Definition (siehe Seite 84).
Der Wertbereich der
Regressi-
Unkoeffizienten
Es ist nicht beschränkt, mit anderen Worten: die Steigerung der
Regression
Problem 4.8: Korrelationskoeffizient und Regressionsreihenlösung: (Stieg der Regressionsreihen ist positiv) Korrelationskoeffizient und Steigung der Regressionsreihen haben die gleichen Merkmale (siehe auch Problem 4.6).
Bivariate Datenbeschreibung
Aufgabe 4.9:
Vergleiche
Messverfahren für Eier
Lösung:
(Korrelationskoeffizient und Regressionslinie)
Ein neues Messverfahren wird erwartet, dass es die gleichen Werte wie eine bekannte Referenzmethode misst (außer geringfügige, zufällige Abweichungen). Dann müsste der Korrelationskoeffizient hoch sein (er sollte nur wenig klebrig sein). Dies allein ist jedoch nicht ausreichend, um die Qualität eines neuen Verfahren zu bestimmen. Auch bei einem mathematischen Systemfehler könnte ein Korrelationskoeffizient nahe 1 entstehen. Es ist daher wichtig, auch die Regressionskoeffizienz zu ermitteln; für sie müsste es gelten:
Aufgabe 4.10:
Prognostizieren mit der
Regressionsraten
Lösung:
(Erklärungen 2, 3 und 4 sind abgeleitet)
Die
Eine Regressionslinie beschreibt die Art des Zusammenhangs, in diesem Fall:
Blutdruck sinkt um 4
mmHg pro Tag (Sage 2 richtig).
Korrelationskoeffizient
Sie beschreibt die Stärke des Zusammenhangs, nicht die Art des Zusammenhangs.
Aus der Gleichung der Regressionsreihen erhält man
mmHg
mmHg
(Sprechbericht 3) Zu Beginn der Therapie ergeben sich
mit
mmHg
Es ist jedoch nicht erlaubt, über die Beobachtungs-
Über das Gewichtsgebiet hinaus
Die fünfte Aussage ist also nicht mehr
Wenn man nicht genau weiß, ob ein Zusammenhang zwischen zwei metrischen Merkmalen linear ist, sollte man weder die Kovarianz noch die Korrelationskoeffizienten nach Pearson (die auf Kovarinz basiert) berechnen.
Bivariate Datenbeschreibung
Aufgabe 4.12:
Wertbereiche
Lösung:
(4 Messwerte sind nicht negativ)
Diese sind: Spannweite, Variation, Standard Abweichung und
Die Kommission hat sich in diesem Zusammenhang mit dem Vorschlag befaßt.
3 ist nur dann gleich 0, wenn alle
übereinstimmen der Stichprobenwerte; andernfalls
sind sie Po
Das ergibt sich aus der Definition dieser Kennzahlen.
Ich glaube,
Das ist das Quadrat
und kann daher niemals negativ sein.
wenn der Stich
das Minimum, das Maximum, das Mo
Das heißt:
und der
Median negativ sein.
Der Korrelationskoeffizient und die
Covalentität sind
Problem 4.13: Zusammenhang zwischen Körpergröße e und Gewicht Lösung: (beide Aussagen richtig, Verknüpfung falsch) Der Zusammenhang ist gleichbedeutend, also ist der Korrelationskoeffizient positiv (große Menschen wiegen viel, kleine eher weniger). Die Werte von Körpergröße und Gewicht sind immer positiv. Also sind Aussagen 1 und 2 richtig, aber nicht ihre Verknüpfung. Aussage 2 enthält keine Informationen über den Korrelationskoeffizient; dieser kann positiv oder negativ sein (siehe auch Beispiel auf Seite 73 des Buches, Zusammenhang zwischen Isoflurane und Blutdruck).
Aufgabe 4.14:
Abhängig und unabhängig
Lösung:
(Größe sollte das unabhängige Merkmal sein)
Antwort A ist Unsinn: Natürlich lässt sich der Zusammenhang durch eine
Regressionsmaßnahmen
Gleichung (dies ist ein allgemeiner Begriff als
Das ist der Fall, in dem die
Es ist nicht gleichgültig, welches
- und was ist das?
- Merkmal ist (Antwort)
B ist also falsch.
- Das kann wohl sein.
-Kennzeichnung auf der Grundlage der
Regressionen
In den einzelnen Fällen ist es daher notwendig,
Überlegen
In diesem Fall ist die Größe
Die Gewichtung ist in gewissem Maße beeinflusst, umgekehrt.
Das ist nicht der Fall: Frauen können zwar ihr Gewicht beeinflussen,
durch sich ändert
In der Schwangerschaft nimmt man an, ohne zu wachsen. Aus diesen Überlegungen folgt, dass die Antwort C falsch und D richtig ist. Schließlich ist die sinnlose Aussage von E zu beachten: Für die Berechnung des Korrelationskoeffizients ist es unerheblich, welches der beiden Merkmale abhängig oder unabhängig ist.
5 Grundlagen der Wahrscheinlichkeitsberechnung
Teil II:
Das ist wahr.
Wahrscheinlichkeitsrechnung
Grundlagen der Wahrscheinlichkeitsberechnung
Aufgabe 5.1:
Ein Wahrscheinlichkeitsbereich
Geben Sie den kleinsten Abstand an, der den
Ein Wahrscheinlichkeitsbereich
Problem 5.2: Unabhängige Ereignisse Die folgenden Sätze enthalten jeweils 2 Ereignisse. bei welchen Aussagen sind die Eigenschaften voneinander abhängig?
Das erste Kind einer Familie ist weiblich, das zweite auch (keine
Einheitliche Zwischengespräche
Ein Kind ist männlich Geschlecht, das Geschlecht der Mutter ist weiblich. Ein männlicher Patient hat Hämophilie. Eine Person hat Blutgruppe A und Rhesusfaktor negativ. Ein Vater ist 195 cm groß, sein Sohn nur 182 cm groß. Eine 20-jährige Frau erkrankt an einem Brustkrebs.
bei allen Aussagen
bei keiner Aussage
Nur bei 2 und 5
Nur bei 2, 3 und 5
Nur bei 2, 5 und 6
Aufgabe 5.3:
Wahrscheinlichkeit von Kinderkriegen
Ein Vater von vier Jungen plant mit seiner Partnerin ein weiteres Kind und wünscht sich ehrgeizig ein Mädchen. Wie groß ist die Wahrscheinlichkeit, dass sein Wunsch erfüllt wird?
5 Grundlagen der Wahrscheinlichkeitsberechnung
Die Wahrscheinlichkeit kann nicht aus den vorhandenen Angaben ermittelt werden
Werden. Aufgabe 5.4: Komplementäre Ereignisse In wie vielen Ereignispaaren handelt es sich um komplementäre Ereignisse? Rhesusfaktor positiv Rhesusfaktor negativ Blutgruppe A Blutgruppe B Geschlecht männlich Geschlecht weiblich schwanger Geschlecht männlich Würfeln: Augenzahl 6 Augenzahl Herz-Krankheit Diabetes-Krankheit Aufgabe 5.5: Zusatzsatz und sein 2 beliebige Ereignisse. Welche Aussage gilt allgemein?
Aufgabe 5.6:
Wahrscheinlichkeiten bei diagnostischen Verfahren
In einer gynäkologischen Klinik wird routinemäßig jede Frau auf das Vorhandensein von
Einer der
Es wird untersucht, ob die
Mammographie und die
Schwerpunkt:
Annahme durch die Kommission
die Methoden, die
Sie werden unabhängig voneinander durchgeführt.
Wahrscheinlichkeit bei einer kranken Frau, eine Krebserkrankung mit
Mammographie
Entdecken
mit einem Gehalt von 90%;
Palpation liegt diese Währung
5 Grundlagen für die Wahrscheinlichkeitsberechnung 10% 40% 45% Aufgabe 5.7: Krankheiten und Wahrscheinlichkeit In einer Klinik liegt der Anteil der Patienten mit Diabetes mellitus bei 20%.
30% der Patienten leiden an einer Herzkrankheit; 5% haben beide Krankheiten.
Wie hoch ist der Anteil der Patienten, die entweder Diabetes oder Herzkrankheit haben? 20% 30% 45% 40% 50% Aufgabe 5.8: 10 Merkmale eines Patienten Bei einem bestimmten Patienten werden die Werte von 10 medizinisch relevanten Merkmalen erhoben. Die Wahrscheinlichkeit, dass ein Messwert innerhalb des Normenbereichs liegt, beträgt für jedes dieser Merkmale 95%.
Aufgabe 5.9:
Multiplikationssatz
Wann gilt:
Diese Gleichung ist im Allgemeinen richtig. Diese Gleichung gilt nur, wenn und unabhängige Ereignisse sind. Diese Gleichung gilt nur, wenn und disjunkte Ereignisse sind. Diese Gleichung gilt nur, wenn und komplementäre Ereignisse sind. Diese Gleichung gilt im Allgemeinen nie.
5 Grundlagen der Wahrscheinlichkeitsberechnung
Aufgabe 5.10:
Semmelweis Berechnung einer Wahrscheinlichkeit
Ignaz
Semmelweis stellte für einen Monat im Jahr 1846 fest, daß in einer Abteilung
In den Wiener Geburtenhäusern sind 24% der Geburtenfrauen an Babybettfieber erkrankt.
Das ist wahr.
Die Wahrscheinlichkeit, an Infektionsfieber zu sterben, lag damals bei 80%.
dann die Wahrscheinlichkeit, dass eine Frau an Kinderbettenfieber erkrankt,
und
zu dieser
104% 80% 24% ungefähr 19% Aufgabe 5.11: Krebs im Versuchstier. Bei einem Versuchstier werden 2 Stellen am Rücken mit 2 verschiedenen Krebsgenen gepinkelt. Die Wahrscheinlichkeit, ein Krebs zu erzeugen, beträgt 0,3 bzw.
Wie hoch ist die Wahrscheinlichkeit, daß die
1.1, 0,8 0,3 0,24 0,86 Aufgabe 5.12: Erwartungswert beim Würfen Mit einem roten und einem blauen Würfel wird gleichzeitig geworfen. Die Augenzahl des roten Würfels wird verdoppelt; daraus wird die Augenzahl des blauen Würfels abgezogen. Was ist der Erwartungswert der so berechneten Zufallsvariable?
10,5
3,5
5 Grundlagen der Wahrscheinlichkeitsberechnung Aufgabe 5.13: Transformation einer Zufallsvariable Eine stetige Zufallsvariable hat den Erwartungswert und die Varianz. Alle Werte von werden nun nach und sind konstante Zahlen transformiert).
Was ist das?
Was ist das?
Was ist das?
Was ist das?
Was ist das?
Aufgabe 5.14:
Empirische Ermittlung einer Wahrscheinlichkeit
In der medizinischen Forschung wird eine Wahrscheinlichkeit in der Regel empirisch
Ermit
Eine ausreichend große Stichprobe wird bezüglich eines Merkmals unter
Der Wert der relativen Häufigkeit eines Ausdrucks wird dann als
Das Ergebnis ist, daß die Zahl der
Ach ist das
Das ist eine lange Tradition, aber sie ist in keiner Weise gerechtfertigt. nach den Axiomen von Kolmogoroff. nach dem Gesetz der großen Zahl. nach der Definition der Wahrscheinlichkeit von Laplace. nach der Tschebischefs-Ungleichheit.
5 Grundlagen der Wahrscheinlichkeitsberechnung
Aufgabe 5.1:
Ein Wahrscheinlichkeitsbereich
Lösung:
(alle Werte zwischen 0 und 1)
Eine Wahrscheinlichkeit kann als relative Frequenz alle Werte zwischen 0 und 1 (einschließlich der Grenzen) annehmen, aber keine Werte außerhalb dieses Bereichs. Da nach dem kleinsten Intervall, der dieses Bereich enthält, gefragt wird, ist Antwort D korrekt.
Aufgabe 5.2:
Unabhängige Ereignisse
Lösung:
(nur 2, 3 und 5)
Ob zwei Ereignisse voneinander abhängig oder unabhängig sind,
Schwerpunkte:
Es bedarf nicht langer Ausführungen, daß das Geschlecht eines
Kind, das nicht das Geschlecht des nachfolgenden Geschwisters beeinflusst (2) und
Das Geschlecht eines Babys ist unabhängig von der Tatsache, dass seine Mutter eine Frau ist (3). Ein Medizinstudent sollte wissen, dass die Wahrscheinlichkeit für Blutgruppe A etwa 42% beträgt, unabhängig davon, ob der Rhesusfaktor positiv oder negativ ist (5). Alle anderen Ereignisse sind jedoch voneinander abhängig.
Dies ergibt sich aus einfachen Überlegungen und geringfügigen medizinischen Bedürfnissen.
Fachkenntnisse. Aufgabe 5.3: Wahrscheinlichkeit bei Kinderkriegen Lösung: = 1/2) Die Wahrscheinlichkeit, dass ein neugeborenes Kind weiblich ist, beträgt bei jeder Geburt = 1/2. So ist auch das fünfte Kind mit 50% Wahrscheinlichkeit ein Mädchen, unabhängig davon, welches Geschlecht die älteren 4 Geschwister haben.
Aufgabe 5.4:
Ergänzende Ereignisse
Lösung:
(Funktion 3)
Ergänzende Ereignisse sind
Dies gilt jedoch nicht für Paare 2 und 4 (es gibt andere Blutgruppen A und B sowie Personen, die weder männlich noch schwanger sind). 5 Grundlagen für die Wahrscheinlichkeitsberechnung Das sechste Paar (Diabetes und Herzkrankheit) ist leider nicht disjunkt und damit auch nicht komplementär.
Aufgabe 5.5:
Zusatzsatz
Lösung:
Der Zusatzsatz in seiner allgemeinen Form ist die Gleichung unter B. Er beschreibt die Wahrscheinlichkeit, dass das Ereignis, das Ereignis oder auch beide Ereignisse eintreten (siehe Seite 106 des Buches).
Die Gleichung unter A quantifiziert die Wahrscheinlichkeit, dass
entweder A oder B
wenn ein Ereignis eintritt (d. h. nur ein Ereignis, aber nicht beides zusammen).
und
Disjunkt
sind, ist die Antwort C richtig; wenn
und
Die Wahrscheinlichkeit, dass eine Mammographie oder eine Palpation das Krebs nicht entdeckt, beträgt jeweils 0,1 Tipps. Das Ergebnis ist 0,4. Mit dem Zusatzsatz für unabhängige Ereignisse (Formel 1 , Seite 1 , Seite 1 , eine Palpation ist die Wahrscheinlichkeit, dass die Mammographie oder die Palpation nicht vollständig erfolgt, aber die Wahrscheinlichkeit, dass die Palpation durch die Mammographie oder die Palpation erfolgt, ist nur 0,4 Tipps.
Aufgabe 5.7:
Krankheiten und Wahrscheinlichkeit
Lösung:
(0,40)
Die Wahrscheinlichkeit, dass ein Patient an einer Krankheit leidet (Diabetes oder Herz oder beides), wird durch den Additionssatz ergeben: . Hier wird jedoch die Wahrscheinlichkeit gefragt, dass ein Patient entweder Herz- oder Diabetes-Krankheit hat. Die Wahrscheinlichkeit, dass beide Krankheiten vorhanden sind, ist also ausschließlich gering. Daher muss die Wahrscheinlichkeit der Durchschnittsmenge subtrahiert werden. Das Ergebnis ist: 5 Grundlagen der Wahrscheinlichkeitsberechnung Aufgabe 5.8: 10 Merkmale einer Patientenlösung: Auch hier ist es am besten, die Wahrscheinlichkeit für das komplementäre Ereignis zu bestimmen: Die Wahrscheinlichkeit, dass alle 10 Parameter innerhalb des Bereichs liegen, beträgt (Unabhängigkeit).
eine
Wenn ein Patient 10 Werte erfasst, kann kaum davon ausgegangen werden, dass diese unabhängig voneinander sind. Dennoch zeigt die Aufgabe, dass man als behandelnder Arzt vorsichtig sein sollte, etwa bei der Bewertung von Laborwerten. Die Wahrscheinlichkeit, dass einer von 10 Werten aus der Reihe fällt, ist hoch. Ein einzelner Ausfallwert sollte daher nicht überbewertet werden.
Aufgabe 5.9:
Multiplikationssatz
Lösung:
(nur für unabhängige Ereignisse)
Die Bedeutung dieser Aussage wird klargestellt:
und
sind unabhängig,
Einfluss auf das Ereignis
in keiner Weise die Wahrscheinlichkeit für das Auftreten von
Die Zahl der Personen, die in der Regel in der Regel in der Europäischen Gemeinschaft leben, beträgt im Vergleich zu denjenigen, die in der Europäischen Gemeinschaft leben, die in der Europäischen Union leben, die in der Europäischen Union leben, die in der Europäischen Union leben, die in der Europäischen Union leben und die in der Europäischen Union leben, die in der Europäischen Union leben, die in der Europäischen Union leben und die in der Europäischen Union leben, die in der Europäischen Union leben und die in der Europäischen Union leben, die in der Europäischen Union leben.
Wahrscheinlichkeit für Blutgruppe A ist 42%; egal, ob sie sich auf Frauen, Männer oder die Gesamtbevölkerung bezieht. Siehe auch Seite 108 des Buches. Aufgabe 5.10: Symbole Berechnung einer Wahrscheinlichkeit Lösung: (etwa 19%) Antwort A ist falsch Sie können die fragliche Wahrscheinlichkeit sehr gut berechnen.
Offensichtliche Unsinn ist auch die Antwort B: Eine Wahrscheinlichkeit kann nie überschreiten
Unter C ist die bedingte Wahrscheinlichkeit angegeben, dass eine
Die Frau, die krank ist, stirbt (die Frau, die krank ist, stirbt).
Lettalität) mit
Unter "D" finden Sie die
Es ist jedoch nicht möglich, dass eine Frau erkrankt ist.
Inzidenz) mit
Nach dem ...
Mehrfach
Vermutungsrate (5.9) wird für die Wahrscheinlichkeit berechnet,
für Kranke und
zu sterben (die Sterblichkeit)
5 Grundlagen der Wahrscheinlichkeitsberechnung
Aufgabe 5.11:
Krebs im Versuchstier
Lösung:
(0,86)
Es ist einfach, den Additionssatz für unabhängige Ereignisse anzuwenden (Formel).
5.10), Seite 108) und erhält:
(sollte auch ohne
Aufgabe 5.12: Erwartungswert bei Würfeln Lösung: (3.5) Der Erwartungswert bei jeder der Zufallsvariablen ist 3.5; das gewünschte ist der Erwartungswert der Variablen . Nach Gleichungen (5.23) und (5.24) gilt:
Aufgabe 5.13:
Transformation einer Zufallsvariable
Lösung:
Das Erwartungswert ändert sich analog zu den Zufallsvariablen (d. h.
) wegen der
die quadratische Dimension der Variation wird diese mit dem Faktor
multipliziert;
Konstante
Eine weitere kleine Anmerkung: Bei der Formel (5.30) auf Seite 118 muss es heißen: Var. Bitte verbessern Sie das in Ihrem Buch. Entschuldigung für diesen Tippfehler. Aufgabe 5.14: Empirische Ermittlung einer Wahrscheinlichkeit Lösung: (Gesetz der großen Zahl) Diese Aufgabe wird gestellt, weil oft irgendwelche Namen genannt werden, ohne zu wissen, was dahinter steckt. Das Gesetz der großen Zahl rechtfertigt, dass eine Wahrscheinlichkeit über eine relative Häufigkeit und einen Erwartungswert durch ein Stichprobenmittel geschätzt wird. Dies ist in einer empirischen Weisheit wie Medizin ein Verfahren.
6 Spezielle Wahrscheinlichkeiten in der Medizin
Spezielle Wahrscheinlichkeiten in der Medizin
Aufgabe 6.1:
Epidemiologische Messwerte
Eine Bevölkerung wird ein Jahr lang beobachtet.
das Ereignis innerhalb dieser Zeit
wenn sie an einer bestimmten Krankheit erkrankt sind; und
Die Wahrscheinlichkeit des Todes durch das Ereignis zu ordnen sind die folgenden Begriffe: Krankheitsspezifische Mortalität Sterblichkeit Inzidenz Prävalenz 1a, 2b, 3c 1c, 2b, 3a 1c, 2a, 3b 1d, 2a, 3b 1d, 2a, 3b 1d, 3c Aufgabe 6.2: Berechnen Sie eine Sterblichkeit In einer Intensivstation leiden 20% der Patienten an Lungenentzündung, die Sterblichkeit bei dieser Krankheit beträgt 70%. Wie hoch ist dann die Krankheitsspezifische Sterblichkeit?
90 Prozent
45%
3,5%
14 Prozent
Die Sterblichkeit kann nicht aus den Daten berechnet werden. Aufgabe 6.3: Risiken bei Mammakarzinom Von allen Frauen, die nicht familiär vorbelastet sind, wird etwa jeder 10. in ihrem Leben an einem Mammakarzinom erkrankt. Wenn ein naher weiblicher Verwandter bereits an einem Mammakarzinom erkrankt war oder ist, steigt der Wert für die Wahrscheinlichkeit, erkrankt zu sein, auf das 3.5-fache. Wie hoch ist dann das zugeschriebene Risiko für den familiären Faktor?
eine hohe Spezifität
eine hohe Sensibilität
eine geringe Spezifität
eine niedrige Sensibilität
Spezifität und Sensibilität sollten gleich hoch sein
Aufgabe 6.5:
Diagnoseuntersuchung falsche Ergebnisse
Ein diagnostischer Test hat eine Empfindlichkeit von 95%;
Die Wahrscheinlichkeit eines falsch-negativen Testergebnisses beträgt 5%, die Wahrscheinlichkeit eines falsch-negativen Testergebnisses beträgt 5%, der positive Vorhersage beträgt 5%, die Spezifität beträgt mindestens 95%.
Die Prävalenz einer Krankheit ist 0,0001. Ein diagnostischer Test hat eine Spezifität von 0,995 und eine Empfindlichkeit von 0,98. Wie groß ist etwa der positive Vorhersagewert?
0,02
0,98
0,50
0,999
Problem 6.7: Diagnosetest Veränderung des Schwellenwerts Bei vielen Tests hängt das Ergebnis auch von einem Schwellenwert ab. Wie ändert sich die Empfindlichkeit und die Spezifität, wenn der Schwellenwert abgesenkt wird?
Die Empfindlichkeit und die Spezifität bleiben unverändert. Die Empfindlichkeit sinkt, die Spezifität steigt. Die Empfindlichkeit sinkt, die Empfindlichkeit steigt. Die Empfindlichkeit und die Spezifität werden größer. Die Empfindlichkeit und die Spezifität werden kleiner.
6 Spezielle Wahrscheinlichkeiten in der Medizin
Aufgabe 6.8:
Diagnostischer Test Interpretation des Ergebnisses
Bei einem jungen Mann, der Drogenabhängig ist, wird ein HIV-Test durchgeführt (die
Prävalenz
Das Ergebnis des Tests ist positiv. Wie ist dieses Ergebnis zu interpretieren? Das Ergebnis beweist eindeutig, dass der Patient infiziert ist. Das Ergebnis beweist eindeutig, dass der Patient nicht infiziert ist.
Die Angabe, dass der Patient Drogenabhängig ist, ist für die Interpretation des Ergebnisses irrelevant. Aufgrund des Ergebnisses des Tests kann eine HIV-Infektion nicht ausgeschlossen werden. Für eine sichere Diagnose ist das Ergebnis jedoch unzureichend.
Aufgabe 6.9:
Der Zusammenhang zwischen Sensibilität und
Besonderheit
Bei einigen Tests lassen sich die Empfindlichkeit und die
Einfluss auf die Spezifität.
Argumente sprechen für eine hohe Sensibilität? es handelt sich um eine Krankheit mit schweren Folgen für den Patienten es gibt eine vielversprechende Therapie diese Therapie hat unter Umständen schwere Nebenwirkungen die Therapie ist sehr teuer die Therapie stellt den Patienten vor enormen psychischen Belastungen falsch-positive Ergebnisse können relativ einfach geklärt werden alle Argumente sprechen für eine hohe Sensibilität nur die Argumente, die die Therapie betreffen (2, 3, 4 und 5) nur die Argumente, die die die Belastungen der Patienten betreffen (1 und 5) nur die Argumente 1, 2 und 6 keine dieser Aufgabe 6.10: Verteilung Funktion bei Sterblichkeit Stellen mit den Sterblichkeitszahlen der Personen, die im Jahr 1900 geboren wurden.
Hierzu sind nur die Definitionen der Begriffe bekannt (siehe Buch Seite 125f.) Aufgabe 6.2: Berechnen einer Mortalität Lösung: (14 %) Nach Formeln (6.1) wird die Mortalität als Produkt aus Inzidenz und Leiden berechnet: Aufgabe 6.3: Risiken bei Brustkrebs Lösung: (überschreibbares Risiko 0.25) Das Krankheitsrisiko ohne den familiären Risikofaktor beträgt, bei familiären Belastungen ist es 3,5 mal so hoch, also . Dann beträgt nach (6.3) das zugeschreibbare Risiko . d. h. der Anteil von 0.25 ist der familiären Belastung zu schreiben, der Anteil von 0.1 geht auf andere Ursachen zurück. Das Risiko ist nach (6.2) gleich dem relativen Risiko von 3.5.
Aufgabe 6.4:
Diagnostische Tests in der
Notfallmedizin
Lösung:
(hohe Sensibilität)
Dies ist ein extremes Beispiel, das jedoch die Bedeutung einer hohen Sensibilität unterstreicht. Wenn es um eine lebensbedrohliche Krankheit geht (und mit einer guten Therapie), sollte ein Test fast alle kranken Personen erkennen.
Aufgabe 6.5:
Diagnoseuntersuchung falsche Ergebnisse
Lösung:
(die Wahrscheinlichkeit für falsches Negativ ist 5%)
Empfindlichkeit ist die Wahrscheinlichkeit, dass der Test
Wirklich positiv
Er erkennt das.
ein ergänzendes Ereignis ist
falsch negativ
Die Wahrscheinlichkeit wird dann berechnet.
als
Analog ergänzen
Es handelt sich hierbei um die spezifische (richtige negative) und die richtige
Wahrscheinlichkeit für falsch positiv.
Spezifikation ist jedoch nicht angegeben, lassen Sie
die Wahrscheinlichkeit von Falsch-Positivität (Antwort A) oder der
6 Besondere Wahrscheinlichkeiten in der Medizin Aufgabe 6.6: Diagnosetest Positive Vorhersage Lösung: (0,02) Es geht hier keineswegs darum, den Vorrang nach der Bayes-Formel (6.14) zu berechnen, aber ein Kandidat sollte wissen, dass bei geringer Prävalenz der positive Vorhersage sehr niedrig ist.
Aufgabe 6.7:
Diagnostischer Test Veränderungen des Schwellenwertes
Lösung:
Je kleiner der Schwellenwert ist, desto mehr positive Testergebnisse werden erzielt. Dies bedeutet, dass mehr kranke Personen richtig positiv bewertet werden (das erhöht die Empfindlichkeit), aber andererseits, dass mehr gesunde Personen falsch positiv erkannt werden. Ein höherer Anteil an falsch positiven Ergebnissen kommt mit einer geringeren Spezifität (siehe auch Tabelle 6.5).
Aufgabe 6.8:
Diagnostischer Test Interpretation des Ergebnisses
Lösung:
Es ist klar, dass die Antworten A und B falsch sind. Ein positiver Test-Ergebnis allein kann nie eindeutig beweisen, dass die Krankheit vorhanden ist (und gar nicht, dass sie ausgeschlossen werden kann). Viele praktisch tätige Ärzte entscheiden intuitiv nach Aussage C, in dem die Sensibilität mit dem positiven Vorhersagen gleichgestellt wird.
Die Tatsache, dass der Patient Drogenabhängig ist, bedeutet eine höhere Prävalenz und damit auch eine hohe positive Vorhersage.
Aufgabe 6.9:
Der Zusammenhang zwischen Sensibilität und
Besonderheit
Lösung:
(1, 2 und 6)
Eine hohe Sensibilität bedeutet, dass möglichst viele
Die richtige Positivität (d. h.
die Argumente 1 und 2 sind eindeutig),
Fehl-negative Ergebnisse
Ein weiteres Problem ist, dass
Falsch-positive Ergebnisse weit
weniger tragisch als ein
Dies spricht auch für eine hohe Sensibilität.
Tag
Gen Sprec
Die Argumente 3 bis 5 sind eher dafür, dass unnötige Therapeutische Maßnahmen erforderlich sind.
Vergütung
Sie werden vermieden werden.
Das Ergebnis ist falsch positiv und damit für eine hohe
Besonderheit
6 Spezielle Wahrscheinlichkeiten in der Medizin
Aufgabe 6.10:
Verteilungsfunktion bei Sterblichkeitstafeln
Lösung:
(z. B. Alter)
Diese Funktion ist wie jede andere Verteilung monoton wachsend und
Es ist sehr sicher (wahrscheinlich 1), dass man höchstens 120 Jahre alt wird (oder älter).
7 Einige theoretische Verteilungen
Einige theoretische Verteilungen
Aufgabe 7.1:
Binomialverteilung Therapie
Eine Therapie ist mit der Wahrscheinlichkeit
Dann ist die Wahrheit
Die Wahrscheinlichkeit, dass mindestens 8 von 10 Behandlungen erfolgreich sind, ist gleich.
Keine der Antworten A-D ist korrekt
Aufgabe 7.2:
Binomialkoeffizient
Welcher der folgenden Ausdrücke quantifiziert die Anzahl der Möglichkeiten, aus 49
Problem 7.3: Binomialverteilung Verlosung Beide Partner eines Elternpaares haben die Voraussetzung für eine rezessive Verlosung im heterozygoten Zustand. Sie haben Kinder; sind die Anzahl der Kinder mit heterozygoten Erbpflanzen. Welche Aussage ist nicht zutreffend?
Die Verteilung von ist symmetrisch. hat den gleichen Erwartungswert wie die Zufallsvariable, die die Anzahl der Kinder mit Homozygot-Krankheit beschreibt. 7 Einige theoretische Verteilungen Aufgabe 7.4: Poisson-Verteilung Kinder mit Down-Syndrom Die Anzahl der Kinder, die im Mannheim-Klinikum geboren werden, beträgt etwa pro Jahr. Die Wahrscheinlichkeit, dass ein Neugeborener mit Down-Syndrom geboren wird, beträgt. Wir gehen davon aus, dass die Ereignisse unabhängig voneinander sind. Die Anzahl der Kinder mit Down-Syndrom ist. Welche Aussage stimmt nicht?
Die Variante von 2 ist eine diskrete Zufallsvariable, die theoretisch alle Werte zwischen 0 und 2000 annehmen kann.
Aufgabe 7.5:*
Poissonverteilung Geburtstag
Wie hoch ist die Wahrscheinlichkeit, dass in einer Übungsgruppe mit 30 Studenten am Tag der Prüfung ein Student einen Geburtstag hat? Keine der Antworten A-D ist korrekt. Aufgabe 7.6 Verteilung der Wochentage Wir gehen davon aus, dass der Wochentag keinen Einfluss auf das Auftreten eines Spontange-Burts hat. Dann folgt die Verteilung der Geburtszeiten auf die Wochentage einer Poisson-Verteilung einer diskreten Gleichverteilung einer binomischen Verteilung einer Normalverteilung einer Polynomialverteilung 7 Einige theoretische Verteilungen Aufgabe 7.7 Spezielle Normalverteilungen Welche der folgenden Merkmale oder Zufallsvariablen sind normalverteilbar?
Körpergröße von erwachsenen Frauen
Körpergröße der gesamten erwachsenen Bevölkerung
Körpergewicht der erwachsenen Frauen
Messfehler
Lebensdauer
die Mittelwerte, die aus zahlreichen Umfangsproben gewonnen wurden
aus einer
Bestimmte Grundgesamtheit zu berechnen
ein binomial verteiltes Zufallsvariable
Nur 1, 4, 6 und 7
Nur sechs und sieben.
Nur 15
keine
alle
Aufgabe 7.8
Normalverteilung Allgemeine Eigenschaften
Welche Aussage ist richtig? Bei einer normalen Verteilung liegen alle Werte zwischen und je größer die Variante, desto flacher läuft die Glockenkurve. Normalerweise stimmen der Erwartungswert und der Median nicht überein. Der Erwartungswert ist immer gleich 0.
Das Erwartungswert kann keine negativen Werte annehmen. Aufgabe 7.9 Normalverteilung Dichtefunktion Welche Aussage ist falsch Die spezielle Form der Glockenkurve ist unabhängig von der Variation Die Dichtefunktion wird durch eine Glockenkurve grafisch dargestellt.
Die Dichtefunktion ist symmetrisch gegenüber dem Erwartungswert
Das Integral unter der gesamten Kurve hat den Wert 1. Die Dichtefunktion hat für alle Werte zwischen und einen Funktionswert, der größer als 0 ist. 7 Einige theoretische Verteilungen Aufgabe 7.10 Standard Normalverteilung sei und Standard Normalverteilung sei. Welche Aussagen sind richtig?
Durch
wird
Nur 1 und 3 sind richtig. Nur 1, 3 und 4 sind richtig. Nur 2, 3 und 4 sind richtig. Nur 1 ist richtig. Aufgabe 7.11: Normalverteilung Transformationen von Si normal verteilt. Welches der folgenden Aussagen falsch ist normal verteilt mit ist normal verteilt mit Standard normal verteilt.
ist normal verteilt mit
ist normal verteilt mit
ist normal verteilt mit
Aufgabe 7.12:
Normaler Verteilung
Referenzbereiche
Die Körpergröße von männlichen Studierenden
Normal verteilt mit einem Erwartungswert
von
cm und einer Standardabweichung von
Wie hoch ist der Prozentsatz der
Schüler sind dann größer als 186 cm oder kleiner als 168 cm? etwa 32 % ungefähr 5 % ungefähr 18,5 % ungefähr 34,5 % ungefähr 95 % 7 Einige theoretische Verteilungen Aufgabe 7.13: symmetrische Verteilungen Welche der folgenden Verteilungen sind symmetrisch? Standard Normalverteilung Normalverteilung allgemein Binomialverteilung mit Poissonverteilung diskrete Gleichverteilung Verteilung zur Beschreibung der Lebensdauer von Personen - Verteilung Chi - Verteilung nur 1 ist symmetrisch nur 1 und 2 sind symmetrisch nur 1, 2, 3, 5 und 7 sind symmetrisch alle außer 4 und 6 sind symmetrisch alle außer 6 sind symmetrisch Aufgabe 7.14: Verteilung des mittleren Blutdrucks bei gesunden Männern zwischen 20 und 30 Jahren ist symmetrisch-Hisson-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-Himmer-H
so verteilt wie die Blutdruckwerte der Studierenden.
normal verteilt mit
mmHg und unbekannte Variante
normal verteilt mit
mmHg und
mmHg
normal verteilt mit
mmHg und
mmHg
7 Einige theoretische Verteilungen Aufgabe 7.1: Binomialverteilung Therapie Lösung: Mindestens 8 erfolgreich bedeutet, dass 8, 9 oder 10 Behandlungen erfolgreich sind. Dies kann durch die Wahrscheinlichkeitsfunktion der Binomialverteilung, Formel (7.6) auf Seite 145 berechnet werden.
Die Angaben in Antwort B quantifizieren die Wahrscheinlichkeit, dass
Genau.
8 Therapien
Problem 7.2: Binomialkoeffizient Lösung: Der Binomialkoeffizient quantifiziert die Anzahl der Möglichkeiten, aus einer 49-Element-Menge 6 Objekte auszuwählen. Genau danach ist gefragt. Dieser Ausdruck entspricht ungefähr 14 Millionen und somit sind die Aussichten auf ein 6er im Lotto gering. Es ist wichtig zu wissen, dass: Die Kugeln werden in Folge gezogen und nicht zurückgezogen; die Reihenfolge der gezogenen Kugeln spielt keine Rolle.
Da die Reihenfolge bei den Lotterieballen unwichtig ist, wird
Noch einmal
Die Wahrscheinlichkeit, dass ein homozygotes Kind krank ist (oder auch homozygotisch gesund ist), beträgt ungefähr 1/4; der Ergebniswert beträgt dann 04: der Pointsverteilung mit den Kindern Downs-Sisson-Lösung: (Stand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-Sand-
Die Kommission ist der Auffassung, daß die
in der Praxis nicht größer
als 6 (siehe auch Beispiel 7.6 auf Seite 151). Aufgabe 7.5:* Poisson-Verteilung Geburtstag Lösung: Ein Student hat Geburtstag, bedeutet: mindestens eins.
Aufgabe 7.6:
Verteilung der Wochentage
Lösung:
Hier gibt es 7 Ausdrücke (das heißt die Wochentage Montag bis Sonntag) mit jeweils einer Wahrscheinlichkeit von 1/7. Dies ist eine diskrete Gleichverteilung. Aufgabe 7.7: Spezielle Normalverteilung Lösung: (Körpergröße, Messfehler, Durchschnittswerte und Körpergröße erwachsener Frauen ist ein Merkmal, das im Gegensatz zum Körpergewicht kaum beeinflusst werden kann. Bei Körpergewicht gibt es insbesondere im normalen Bereich Ausreißer; dieses Merkmal ist (sowie klein wie langlebig) rechtsverteilbar. Wenn man die Größe aller Erwachsenen (heterogene Bevölkerung) betrachtet, erhalten wir eine zweigliedrige Verteilung mit einer iblichen und einer männlichen Gipfel Gipfelverteilung.
Die Kurve
Auf der Seite 160, in Abbildung 7.4, wird festgestellt, dass
Erwartungswert und
Median sind wie bei jeder symmetrischen Verteilung
Problem 7.9: Normalverteilung Dichtefunktion Lösung: (Aussage ist falsch Die spezielle Form der Glockenkurve hängt keineswegs von der Variation ab; je größer die Variation, desto flacher ist die Kurve (siehe Problem 7.8). Alle anderen Ausnahmen sind richtig; siehe Seite 156 ff.
Aufgabe 7.10:
Standard-Normalverteilung
Lösung:
(nur 1 ist richtig)
Die
Die Standard-Normal-Verteilung hat den Erwartungswert 0 und die Variante 1 (Statement)
1) nicht umgekehrt (Aussage 2 ist daher falsch).
Es wird also nicht durch
Alle veränderten Variablen
kann über
Alle linearen Transformationen (A, B, C und E) ändern nichts an der Tatsache der normalen Verteilung. Dabei ändern sich nur der Erwartungswert und die Variante, die sich nach den Formeln (5.23) und (5.29) ergeben. Bei nichtlinearen Transformationen wie z.B.
Die Eigenschaften der Normalverteilung werden verloren. Aufgabe 7.12: Normalverteilung Referenzbereiche Lösung: (etwa 18,5%) Der Bereich ist in diesem Fall der Intervall [174,186], der Bereich 2 ist [168,192]. Innerhalb des Bereichs liegen 68% aller Messwerte, außerhalb von 32%; d. h. größer als die obere Grenze (d. h. 186 cm) sind 16%. Außerhalb des Bereichs 2 liegen etwa 5% 7 Einige theoretische Verteilungen aller Werte; d. h. kleiner als die untere Grenze (168 cm) sind 2,5%. 16% + 2,5% ergeben 18,5 % (siehe auch Tabelle 7.1 auf Seite 161).
Aufgabe 7.13:
Symmetrische Verteilungen
Lösung:
(1, 2, 3, 5 und 7 sind symmetrisch)
Die normale Verteilung ist immer symmetrisch nicht nur die
Standard-Normalverteilung
(siehe Abbildung 7.4, Seite 160).
Symmetrisch, die
Die Poisson-Verteilung ist allgemein
Siehe Abbildung 7.1 7.3, Seite 150.
Gleichverteilung (in der alle Wahrscheinlichkeiten gleich sind) ist symmetrisch. Lebensdauerverteilungen sind dagegen rechtswidrig (z.B. die Lognormalverteilung oder die Exponenzverteilung). Die Verteilung ähnelt der Normalverteilung und ist wie diese symmetrisch im Gegensatz zur Chiverteilung, die rechtswidrig ist (siehe Abbildung 7.8, Seite 179).
Aufgabe 7.14:
Verteilung von Durchschnittswerten
Lösung:
mmHg,
mmHg)
Nach der zentralen
Grenzwerte sind Mittelwerte
Normal verteilt mit der Erwartung
Gesamtspiegelung
und die Variation
(siehe Seite 166).
mmHg und die Standardabweichung
, also 10 mmHg / 5 = 2 mmHg. 8 Schätzungsverfahren Teil III: Induktive Statistik Schätzungsverfahren Aufgabe 8.1: Eigenschaften eines Schätzungsverfahren Welche Aussage ist falsch
Die Schätzungsfunktion ist eine Zufallsvariable, deren Realisierung von
Das Konfidenzintervall ist ein Bereich, der die zu schätzenden Parameter sicher enthält. Um eine erwartungsgerechte Schätzung zu ermöglichen, muss eine repräsentative Stichprobe vorhanden sein. Aufgabe 8.2: Konfidenzintervall für den Erwartungswert Welche der folgenden Aussagen zu einem Konfidenzintervall ist richtig?
Je größer der Stichprobenumfang ist
Die Breite des Konfidenzintervalls ist unabhängig von jedem Konfidenzintervall, der aus einer repräsentativen Stichprobe ermittelt wird.
Aufgabe 8.3:
Standardfehler des Durchschnittswertes
Wie kann er
Umfang der Stichproben
Sie werden geändert, um den Standardfehler des Mitteilungsausschusses zu berücksichtigen.
8.4 Schätzungsverfahren Aufgabe 8.4: Ermitteln eines Konfidenzintervalls mit der Verteilung Mit der Verteilung soll ein zweiseitiges Konfidenzintervall für den Erwartungswert erstellt werden. Welche Parameter werden dafür nicht benötigt?
der durchschnittliche Stichprobewert
die empirische Standardabweichung
die Auswahl der Stichproben
der Quantil
Die
-Verteilung
die Standardabweichung
der Grundgesamtheit
Aufgabe 8.5:
Breite einer
Vertraulichkeitsintervalle
Wovon ist die Breite eines Konfidenzintervalls für
nicht
Abhängig vom Stichprobenumfang vom Stichproben-Mittelwert von der Irrtumswahrscheinlichkeit von der Variabilität der Messwerte, ob das Intervall 1-seitig oder 2-seitig ist. Aufgabe 8.6: Körpergröße-Konfidenz-Intervall Wir nehmen an, dass die Körpergröße der erwachsenen Frauen normal mit der Standardabweichung verteilt ist. Aus einer Stichprobe von 25 Frauen entsteht ein Mittelwert. Damit kann als 2-seitiges Konfidenz-Intervall zur Irrtumswahrscheinlichkeit ermittelt werden: Dieser Intervall kann nicht ermittelt werden, da die empirische Standardabweichung nicht angegeben wird.
Aufgabe 8.7:*
Schätzungsmerkmale von durchschnittlichem Wert und
Median
Der Erwartungswert einer Grundgesamtheit soll geschätzt werden.
Bei falsch verteilten Merkmalen ist die Schätzung über den empirischen Median nicht erwartet. Bei symmetrisch verteilten Merkmalen ist die Schätzung durch den Median zwar erwartet, aber nicht konsistent.
Der
Median liefert immer einen Schätzwert, dessen Abstand vom Erwartungswert
Das Median ist ebenso erschöpfend wie der Durchschnitt. Aufgabe 8.8: * Schätzungen von Varianz und Standardabweichung Welche Aussage ist falsch Bei der Berechnung der empirischen Varianz wird die Schätzung durch geteilt, damit die Schätzung erwartungsfähig ist.
Die Schätzung der Standardabweichung durch die Wurzel aus der empirischen
Bei der Berechnung der empirischen Varianz wird durch geteilt, damit die Schätzung konsistent ist. Die Schätzung der Standardabweichung durch die Wurzel der empirischen Varianz ist konsistent. Je größer der Stichprobenumfang, desto genauer ist die Schätzung der Varianz.
Aufgabe 8.9:
Interpretation eines
Vertraulichkeitsintervalle
In Beispiel 8.4 (Seite 196) wird für den Anteil der weiblichen Medizinstudenten aus einer Stichprobe eine Schätzung von und als 95%-Vertrauen-Intervall erhalten.
Dieser Anteil liegt mit Sicherheit zwischen den Werten 0,311 und 0,559. Der Anteil liegt mit 95% Wahrscheinlichkeit zwischen 0,311 und 0,559. Der Frauen Anteil ist mit einer Wahrscheinlichkeit von 2,5% kleiner als 0,311. Dieser Anteil ist mit einer Wahrscheinlichkeit von 2,5% größer als 0,559.
Es ist schließlich unbekannt, ob der zu schätzende Anteil innerhalb der
Kon-
Es ist nur bekannt, daß das angewandte Verfahren
mit einer Wahrscheinlichkeit von 95%
Kon-
8 Schätzungsverfahren Aufgabe 8.10:* Zensierte Daten Bei Überlebensstudien treten oft zensierte Beobachtungen auf, die mit einem Verfahren nach Kaplan und Meier ausgewertet werden können.
Die Gründe für die Notwendigkeit einer Zensur sollten in keiner
Zensurierte Beobachtungen haben keinen Einfluss auf das Ergebnis der Studie. Mit der Kaplan-Meier-Methode werden zensurierte Daten vollständig eliminiert. Zensurierte Beobachtungen sind völlig problemlos, solange das Probenumfang groß genug bleibt.
Bei den Schätzungen nach
Die Kaplan-Meier-Methode wird zu jedem Beob-
8 Schätzungsverfahren Aufgabe 8.1: Eigenschaften einer Schätzungsmethode Lösung: (diese Aussage ist falsch) Man erhält nur mit 95% Wahrscheinlichkeit ein Konfidenzintervall aus der Stichprobe, der den zu schätzenden Parameter enthält. Alle ihre Aussagen sind korrekt: Das Parameter ist eine unbekannte, konstante Größe (A und B); die Schätzungsfunktion liefert mit jeder Stichprobe einen anderen Schätzungswert (C).
Aufgabe 8.2:
Vertraulichkeitsintervall für den Erwartungswert
Lösung:
(je größer)
, umso kleiner ist der Abstand)
Es ist klar: ein großer
Das bedeutet, dass eine kleine Anzahl von
Diese Abhängigkeit kommt auch in Formeln (8.8) oder (8.9) vor.
Ausdruck. Daher ist B richtig, A und C falsch. Dass die Aussage D falsch ist, wurde oben in Aufgabe 8.1 erklärt. Auch E ist Unsinn: basierend auf dem Mittelwert werden die Intervallgrenzen berechnet. Aufgabe 8.3: Standardfehler des Mittelwerts Lösung: muss vielfältigt werden) Der Standardfehler des Mittelwerts ist (siehe Seite 195 oben). Dieser Fehler wird halbiert, indem man den Kenner verdoppelt.
Aufgabe 8.4:
Die Ermittlung eines
Vertraulichkeitsintervalle mit der
-Verteilung
Lösung:
ist nicht notwendig)
Ein Blick auf die Formel zur Bestimmung der
Konfidenzintervalle (8.10) auf Seite 194
zeigt, dass alle Parameter, die unter AD genannt werden, zur Bestimmung der
Vertrauen
Die Parameter sind in der Regel in der Art und Weise, in der die Zinsintervalle benötigt werden.
Der Grundverhaltenswert (meist
Das ist der Vorteil der Verteilung ! Aufgabe 8.5: Breite eines Konfidenzintervalls Lösung: (Mittelwert) 8 Schätzungsverfahren Der Mittelwert ist die Mitte des Konfidenzintervalls, aber er beeinflusst nicht seine Breite (siehe auch Formel (8.16)). Alle anderen Größen: je größer und größer, desto kleiner ist der Konfidenzintervall (A und B).
; je größer die Variabilität, desto größer ist der Abstand
(Antwort D). Einseitiges Intervall ist unendlich breit; zweiseitiges nicht (E). Aufgabe 8.6: Konfidenzintervall für die Körpergröße Lösung: Hier ist die Standard-Abweichung der Grundversammlung ausnahmsweise bekannt; daher lässt sich das Konfidenzintervall nach (8.8) bestimmen. Der Ausdruck ist ungefähr 2; so entstehen die Grenzen 166 cm und 170 cm.
Aufgabe 8.7:*
Schätzungsmerkmale von durchschnittlichem Wert und
Median
Lösung:
(Median ist bei schwankenden Verteilungen unerwartet)
Bei schönen Verteilungen stimmen Mittelwerte und
Median
nicht
Dies ist nicht der Fall.
Die Schätzung der
Nur bei symmetrischen Verteilungen ist diese
Schätzung
Erwartungsbereitschaft und
B ist also falsch. Offensichtlich
Es wäre ein großer Zufall, wenn das Mittelwert und
Median einer
Es ist nicht möglich, zu sagen, daß der geschätzte
Median
Problem 8.8: Schätzungen von Variation und Standard Abweichung Lösung: (diese Aussage ist falsch A und B sind richtig: die empirische Variation ist eine erwartungsorientierte Schätzung für die Variation des Grundwerts; die Standard Abweichung dagegen nicht (siehe Ausführungsbericht Seite 186).
Aufgabe 8.10:
Zensierte Daten
Lösung:
Zensierte Daten sind problematisch, weil Informationen verloren gehen und sie die
Die Ergebnisse einer Studie können verzerrt werden (B und D sind also falsch). Wenn sie jedoch auftreten, ist darauf zu achten, dass die Gründe nicht mit den kritischen Endereignissen zusammenhängen (Das heißt A). Die Kaplan-Meier-Methode bewertet so viele Informationen wie möglich (Das heißt C ist falsch).
9 Statistische Tests
Statistische Tests
Aufgabe 9.1:
Formulierung der Hypothesen
Ein Forscher hofft, dass ein von ihm entwickeltes Blutdrucksenkermittel
wirkt besser als ein herkömmliches Standardmedikament und möchte dies durch einen Test
Wie soll er seine Vermutung formulieren? als Null-Hypothese als Alternative-Hypothese ist dies gleichgültig dies hängt von den Folgen einer Fehlentscheidung ab dies hängt von ethisch-moralischen Überlegungen ab Aufgabe 9.2: Grundlagen Welche Aussage ist falsch
Die Größe der
-Fehler beeinflusst die Größe des ß-Fehlers. Ob 1- oder 2-seitig getestet wird, muss vor der Durchführung des Tests auf sachlogischer Grundlage entschieden werden.
Die Anzahl der Proben hat keinen Einfluss auf das Ergebnis des Tests. Aufgabe 9.3: Testentscheidungen Welche Aussage ist richtig? Wenn nach der Durchführung eines Tests die Testgröße nicht annehmbar ist, wird die Nullhypothese abgelehnt. Die Größe des Irrtums Art 1 ist zufällig.
Wenn die Nullhypothese nicht abgelehnt wird, wird immer ein Fehler 2. Art. Der Ablehnungsbereich ist immer ein zusammenhängender Intervall. Wenn die Alternative Hypothese richtig ist, ist die Wahrscheinlichkeit, aufgrund des Testergebnisses falsch zu entscheiden, höchstens Aufgabe 9.4: Fehler Bei der Prüfung einer Nullhypothese gegen eine Alternative Hypothese bedeutet eine Wahrscheinlichkeit für den Fehler 1. Art: Die Wahrscheinlichkeit ist höchstens 0.05 dafür, dass 9 statistische Tests angenommen werden, wenn sie richtig sind, beibehalten werden, wenn sie richtig sind, nicht abgelehnt werden, wenn sie richtig sind, abgelehnt werden, obwohl sie falsch richtig abgelehnt werden 9.5: Tests und Merkmale Welcher Test setzt Qualitätsmerkmale voraus?
Die
-Test auf zwei verknüpften Proben
der Wilcoxon-Rangsummtest
Die
- Test
der Chi
-Homogenitätstest
keines dieser Tests
Aufgabe 9.6:
ß-Fehler Allgemeine
Der ß-Fehler ist immer größer als der -Fehler. Der ß-Fehler kann durch die Anzahl der Proben beeinflusst werden. Je größer die Leistung (Gut) eines Tests ist, desto größer ist auch der ß-Fehler.
Der
-Fehler und ß-Fehler sind unabhängig voneinander. Aufgabe 9.7: ß-Fehler beim -Test sind 2 grundlegende Gesamtheiten mit den Erwartungswerten und derselben Variante. Daraus werden 2 Stichproben gezogen und deren Durchschnittswerte mit dem -Test für nicht verknüpfte Stichproben überprüft. Dabei wird die Wahrscheinlichkeit für den ß-Fehler größer, wenn alle Größen gleich bleiben, aber der Stichprobenumfang größer wird, die Wahrscheinlichkeit für den Fehler größer wird, der Betrag des Unterschieds größer wird, die Variante größer wird, die Variante größer wird 9 statistische Tests größer 9.8:
Dies zeigt, dass das neue Präparat von einem Placebo eine grundlegende Rolle spielt.
Das neue Arzneimittel ist mit 95% Wahrscheinlichkeit wirkungslos. Es gibt keinen Unterschied zwischen einem neuen Arzneimittel und einem Placebo. Das Ergebnis des Tests zeigt, dass weitere Forschungen in diesem Bereich sinnlos sind.
Aufgrund des Ergebnisses lässt sich ein Unterschied zwischen dem neuen
Es gibt keine Anzeichen dafür, dass
Das Problem ist jedoch, daß die
Welche Tests erfordern normal verteilte Daten? - Wilcoxon-Rangsumme-Tests - Chi-Tests alle diese Tests keine dieser Tests Aufgabe 9.10: Auswahl eines Tests bei normal verteilten Daten sind zwei unzusammenhängende Proben mit sehr günstigen Voraussetzungen: Die Daten stammen aus zwei normal verteilten Grundgesamten mit gleich großen Varianten. Es soll überprüft werden, ob man die Gleichheit der Erwartungswerte annehmen kann. Welchen Test sollte man bevorzugen?
Die
-Test auf zwei ungebundenen Proben
der Welch-Test
Die
- Test nach Mann, Whitney und Wilcoxon.
Sie wenden sich an alle drei Tests und entscheiden sich dann für einen, der ein signifikantes Ergebnis liefert. Es ist völlig unwichtig, welchen Test Sie anwenden, weil die Voraussetzungen für jeden Test erfüllt sind. 9 Statistische Tests Aufgabe 9.11: Auswahl eines Tests mit falsch verteilten Daten Vergleichen Sie das durchschnittliche Körpergewicht einer Gruppe von Patienten, die ein Jahr lang eine bestimmte Diät aufnahm, mit dem durchschnittlichen Körpergewicht einer vergleichbaren Gruppe, die sich mit normaler Ernährung ernährte. Sie wissen, dass die Gewichte falsch verteilt sind und die Stichmenge pro Gruppe nicht größer als 10 ist. Welcher Test ist am besten geeignet?
Die
-Test für verknüpfte Proben
Die
-Test für ungebundene Stichproben
Die
- Test nach Mann, Whitney und Wilcoxon.
der Welch-Test
der Vorzeichnungsprüfer
Aufgabe 9.12:
-Test auf zwei ungebundenen Proben
Zu einem
-Zwei ungebundene Proben der Größe werden geprüft.
und
Siehe
Wie lautet die Aussage:
falsch
Dieser Test setzt gleiche Variationen der Grundsummen voraus. Die Umgebungen müssen gleich groß sein. Dieser Test setzt normal verteilte Grundsummen voraus. Die Anzahl der Freiheitsgrade beträgt.
Aufgabe 9.13:
Chi
- Test
Bei einem Chi
-Test erfolgt für den Wert der Prüfgröße
Was sagt das ?
Ergebnis? Dieses Ergebnis ist unmöglich, da die Testgröße nur positive Werte annehmen kann. Aufgrund des Testergebnisses wird die Nullhypothese beibehalten; ein ß-Fehler kann jedoch bei dieser Entscheidung nicht ausgeschlossen werden.
Ob man die Null- oder die Alternative-Hypothese annimmt, hängt von der Größe des Fehlers ab.
1. Wenn die Prüfgröße einen Wert von mehr als 3,84 annimmt, wird die Null-Hypothese zugunsten der alternativen Hypothese abgelehnt, um die Unabhängigkeit von zwei alternativen Merkmalen zu überprüfen.
Die Prüfgröße kann im Allgemeinen zwischen
und
Annahme. Aufgabe 9.15: Vorbildstest Welche Aussage ist falsch Der Vorbildstest ist für 2 verknüpfte Proben mit einem quantitativen Merkmal anwendbar. Das zugrunde liegende Modell ist die Binomialverteilung mit dem Test setzt 2 verknüpfte Proben mit gleichen Varianten voraus.
Bevor dieser Test durchgeführt wird, muss die Größe der
Falsch festgestellt
Problem 9.16: Mehrere dieser Tests geben 3 ungebundene Proben an, die jeweils mit dem -Test getestet werden. Insgesamt werden also 3 Tests durchgeführt. Wie groß ist der Fehler Typ 1 bei diesem Verfahren insgesamt?
9 Statistische Tests
Aufgabe 9.1:
Formulierung der Hypothesen
Lösung:
(Alternative Hypothese)
Die Null-Hypothese behauptet immer, dass zwei Parameter (z. B. Erwartungswerte) gleich sind. Die alternative Hypothese (d. h. unterschiedliche Erwartungswerte) wird erst angenommen, wenn die Testgröße schwer mit der Null-Hypothese zu vereinbaren ist. Aufgabe 9.2: Grundlegende Lösung: (Aussage ist falsch Aussagen AD sind richtig. Annahme- und Kritikbereich sind ausgeschlossen (siehe Tabelle Seite 210 und Abbildung Seite 211). Je größer der Fehler, desto kleiner ist der ß-Fehler (und umgekehrt; sie Seite 206).
Aufgabe 9.3:
Testentscheidungen
Lösung:
Wenn die Prüfgröße nicht im Annahmebereich liegt, muss sie im kritischen Bereich liegen.
B: Die Größe des 1. Fehlers (Fehler) wird vor der Durchführung des Tests festgelegt (normalerweise mit =5%) ist also nicht zufällig. C: Wenn die Null-Hypothese beibehalten wird, kann dies auch darauf zurückzuführen sein, dass ihre Aussage tatsächlich richtig ist dann wird man keinen Fehler machen. D: Der Ablehnungsbereich ist nicht immer zusammenhängend (z.B. bei einem 2-seitigen Test, Abbildung 9.1). E: Wenn die Alternative Hypothese in Wirklichkeit richtig ist, kann man keinen Fehler machen (bzw. einen ß-Fehler).
Aufgabe 9.4:
Fehler
Lösung:
Dass die Aussage D richtig ist, wird in Tabelle 9.1 auf Seite 206 deutlich. Zu A und B: diese Entscheidungen wären richtig; sie sind keine Fehler. Unter C wird der ß-Fehler beschrieben. Zu E: diese Formulierung ist schlecht. Die alternative Hypothese kann angenommen werden, aber nicht abgelehnt werden (der Test geht ja von der Nullhypothese aus).
9 Statistische Tests
Aufgabe 9.5:
Tests und Merkmale
Lösung:
(Chi)
-Homogenitätsprüfung)
Für qualitative Merkmale sind Chi in der Regel geeignet.
-Tests. -Tests und Rangsummen-Tests erfordern stetige (d. h. quantitative) Daten, ebenso wie der -Test, der die Gleichheit von 2 Varianten untersucht. Aufgabe 9.6: ß-Fehler Allgemeine Lösung: (abhängig von der Stichprobegröße) Der ß-Fehler kann nicht festgelegt werden; seine Größe hängt von vielen Faktoren ab (A und B sind falsch). Die Qualität eines Tests kann als 1 % ausgedrückt werden (d. h. die Wahrscheinlichkeit, dass bei der Gültigkeit der alten Hypothese ein signifikantes Testergebnis erzielt wird).
Aufgabe 9.7:
ß-Fehler bei
- Test
Lösung:
(größere Variation)
Durch AC wird die
ß-Fehler verkleinert (siehe Tabelle 9.6 und Ausführungen Seite
Es ist logisch, dass bei kleineren Variationen ein Unterschied einfacher nachgewiesen werden kann, was auch zu einer Verringerung des ß-Fehlers führt (E). Umgekehrt führt eine Erhöhung der Variabilität der Messwerte dazu, dass ein schwerer Unterschied nachgewiesen werden kann also eine Erhöhung des ß-Fehlers.
Aufgabe 9.8:
Nicht signifikantes Testergebnis
Lösung:
(Versichtige Interpretation)
Das Ergebnis des Tests zeigt:
Nichts
Beweisen Antworten A und B sind offen.
C: Eine mögliche Differenz in Bezug auf die Wirkung ist nicht zufällig und kann daher nicht mit einer Wahrscheinlichkeit quantifiziert werden (siehe auch Anmerkung auf Seite 208).
9 Statistische Tests
Aufgabe 9.9:
Voraussetzungen
Lösung:
-Tests)
-Tests setzen im Allgemeinen
Normal verteilte Daten voraus, auch wenn diese Voraussetzungen
Die beiden anderen Tests haben schwierige Voraussetzungen (Welch-Test: keine gleich große Variante, Test: keine gleich große Normalverteilung). Obwohl diese Voraussetzungen erfüllt sind, wäre es leicht, diese Tests hierzu zu verwenden, da sie eine geringere Leistungsfähigkeit haben, und daher sollte man nicht versuchen, einen Test zu präsentieren, der genauso schwierig ist, wie der Test.
Aufgabe 9.11:
Auswahl eines Tests bei
Fehlverteilung der Daten
Lösung:
-Test)
Zunächst fallen die
-Test für verknüpfte Stichproben und der Vorzeichner-Test weg, da
Hier sind zwei ungebundene Stichproben vorhanden.
-Tests (auch
Die
Welch-Tests) bezüglich der normalen Verteilung (z. B. wegen der kleinen
Erweiterung der
Aufgabe 9.12: -Test für 2 unabhängige Proben Lösung: (Umfangs müssen nicht gleich groß sein) Dieser Test hat formell sehr strenge Voraussetzungen (siehe Abschnitt 9.2.3 im Buch), aber die Probenumfangs müssen nicht gleich groß sein. Sie sollten jedoch aufgrund der Leistung nicht zu unterschiedlich sein.
9 Statistische Tests
Aufgabe 9.13:
Chi
- Test
Lösung:
(Null-Hypothese beibehalten)
Eine Prüfgröße mit dem Wert 0 kann durchaus entstehen, wenn:
(siehe
A ist also falsch. Mit einem Testergebnis auch mit einem Extrem lässt sich nichts eindeutig beweisen; daher sind C und (zuerst richtig) D falsch. Ebenso E: Das Ergebnis liegt im Bereich der Annahme, daher muss immer die Null-Hypothese beibehalten werden. Eine vorsichtige Interpretation nach B ist notwendig.
Aufgabe 9.14:
Vier Feldprüfungen
Lösung:
(Forschungsgröße nicht negativ)
Falsch ist E. Die Prüfgröße
bei der
Vier-Feld-Test ist wie bei allen Chi
-Tests Größenordnung
Alle anderen Aussagen sind zutreffend (siehe Abschnitt 9.5.1). Aufgabe 9.15: Vorbildstest Lösung: (gleiche Varianten sind nicht vorausgesetzt) Der Vorbildstest wird normalerweise angewendet, um ein stetiges Merkmal bei 2 verknüpften Stichproben zu vergleichen (Antwort A). Weiterhin enthält er keine Voraussetzungen auch keine gleichen Varianten. Das Testverfahren basiert auf der binomialen Verteilung; unter der Nullhypothese gilt: (Antwort B). Der Fehler muss immer vor der Durchfüllung festgestellt werden (Antwort B). Dies ist keine Besonderheit des Vorbildstests. Auch die Antwort E ist zutreffend; der Vorbildstest ist zwar universell anwendbar, führt aber seltener zu einem Randzeichen des entsprechenden Ergebnisses.
Aufgabe 9.16:
Mehrere Tests
Lösung:
Wenn die Null-Hypothese richtig ist, ist die Wahrscheinlichkeit, dass die Null-Hypothese
Aufgrund des Testergebnisses zu behalten
Bei drei Tests, die unabhängig
von
Diese Wahrscheinlichkeit ist
(falls
Die Wahrheit
Wahrscheinlichkeit, eine falsche Entscheidung
Für die Alterna
Hypothese
Das ist der Fall, wenn
- Das hier .
Der Wert ist fast dreimal so groß wie
d. h. bei mehreren Tests steigt der Fehler Art 1.
An. 10 Grundlagen der Versuchsplanung Teil IV: Versuchsplanung Grundlagen der Versuchsplanung Aufgabe 10.1: Zufällige Stichproben Von 20.000 Anästesien sollen in den folgenden Monaten etwa 2.000 für eine Stichprobe ausgewählt und unter verschiedenen Gesichtspunkten ausgewertet werden.
Die in 15 genannten Verfahren liefern ungefähr die erforderliche Anzahl.
Alle Anästesien, für die bestimmte Ärzte verantwortlich sind, alle Anästesien, die an Patienten durchgeführt werden, deren Nachnamen mit einem der Buchstaben AC beginnen, alle Anästesien von Patienten, deren Geburtsdatum bis zum 1., 2. oder 3.
Ein Monat ist
alle Anästesien, die von der Allgemeinen Chirurgie-Klinik durchgeführt werden
alle Betäubungen von Patienten zwischen 20 und 29 Jahren
alle Anästesien, die am Montag durchgeführt werden
Alle Stichproben sind zufällig. Nur 14 sind zufällig. Nur 24 und 6 sind zufällig. Nur 2 und 3 sind zufällig. Keine Stichprobe ist zufällig. Aufgabe 10.2: repräsentative Stichprobe Im Rahmen einer Doktorarbeit soll untersucht werden, wie die Heilung bei 120 Patienten, die im vergangenen Jahr an einem Finger operiert wurden, verlaufen wurde. Zur Datenerhebung wird jedem dieser Patienten ein Fragebogen geschickt, in dem er aufgefordert wird, es auszufüllen und zurückzusenden. Man bekommt die ausgefüllten Bögen von 80 Patienten. Man kann dann davon ausgehen, dass diese 80 Patienten eine repräsentative Stichprobe der 120 operierten Patienten darstellen?
Ja, da die Stichprobengröße
ist sehr groß
Ja, da der Stichprobenumfang im Verhältnis zum Gesamtgehalt sehr groß ist.
Ja, da die Teilnahme an der Fragebogenaktion freiwillig war
Eine Antwort auf diese Frage hängt von den Skalierungsniveaus der zu bewertenden
Merkmale ab. Nr. 10 Grundlagen der Versuchsplanung Aufgabe 10.3: Versuchsplanung Zu welchem Zeitpunkt sollte man in einer klinischen Studie darüber nachdenken, welche statistische Analysemethoden verwendet werden sollten? vor der Formulierung der Fragen vor dem Beginn der Datenerfassung unmittelbar nachdem alle Daten vorhanden sind (vorher nicht möglich) Der geeignete Zeitpunkt entsteht selbst im Laufe der Studie, dieser Zeitpunkt ist irrelevant Aufgabe 10.4: Systematische Fehler Was trägt dazu bei Wenn mehrere Stichproben untersucht werden Vermeidung von systematischen Fehlern?
Beobachtungsgleichheit
Strukturliche Gleichheit
Wahl eines geeigneten statistischen Modells
große Stichproben
repräsentative Stichproben
Aufgabe 10.5:
Zufallsfehler
Was können Ursachen für einen großen Zufallsfehler sein? Kleine Stichproben die intraindividuelle Variabilität der Beobachtungsstellen der interindividuellen Variabilität der Beobachtungsstellen nicht repräsentativen Stichproben fehlerhafte Messungen (z. B. falsches Messgerät) alles unter 15 nur 13 nur 14 nur 14 nur 2 und 3 nur 1 Aufgabe 10.6: Blockbildung Im Vergleich von 2 Augenschalben kann man sinnvoll Blöcke aus den Augenpaaren mehrerer Patienten bilden.
Durch die Erstellung von Blöcken wird der systematische Fehler weitgehend beseitigt.
10 Grundlagen der Versuchsplanung Die Randomisierung trägt zur Strukturgleichheit der beiden Behandlungsgruppen bei. Die Blockbildung trägt zur Beobachtungsgleichheit bei. Der Einfluss von Störgrößen wird ausgeschaltet.
Nur zwei und drei.
Nur 1, 3 und 5
Nur 3, 4 und 5
Nur zwei, drei und vier.
Nur 1, 3, 4 und 5
Aufgabe 10.7:
Schaubildungen von Schichten
Bei größeren Untersuchungen werden Beobachtungsstellen eingesetzt, die sich im Wesentlichen
Es gibt viele verschiedene Eigenschaften, die sich ähneln, in einer Schicht zusammen. Was ist das Vorteil? Das schaltet systematische Fehler aus. Es entstehen offensichtliche Gruppen. Zufällige Fehler werden reduziert. Versuchsfehler insgesamt werden reduziert.
15 nur 2 und 3 nur 24 nur 25 nur 1 und 3 Aufgabe 10.8: Anzahl der Schichten In einer klinischen Untersuchung erscheint es wünschenswert, nach 3 Merkmalen Schichten zu schichten: 1. nach Geschlecht, 2. nach Alter (5 Klassen von jeweils 10 Jahren) und 3.
Nach Krankheitszustand (leichter,
Wie viele Schichten
Die Anzahl der Schichten wird erst im Laufe der Untersuchung ergeben. 10 Grundlagen der Versuchsplanung Aufgabe 10.9: Aufteilung in Behandlungsgruppen Eine streng zufällige Aufteilung in 2 Behandlungsgruppen wird am ehesten mit Hilfe eines Würfels oder einer zufälligen Zahl erreicht, indem man den Patienten die Gruppe auswählen lässt, indem man den behandelnden Arzt die Gruppe auswählen lässt, indem man eine zufällige Anwesende fragt, eine Zahl zwischen 1 und 8 zu nennen, und die Gruppenverteilung erfolgt, je nachdem, ob die genannte Zahl durch systematisches Alternen gerade oder ungleich ist. Aufgabe 10.10: Doppelblindes Studium, wozu die Doppelblindheit in klinischen Studien nicht beiträgt?
systematische Fehler zu vermeiden
Beobachtungsgleichheit zu erreichen
Datenschutz zu gewährleisten
Autosuggestion vom behandelnden Arzt auszuschalten
Autosuggestion von Patienten auszuschalten
10 Grundlagen der Versuchsplanung
Aufgabe 10.1:
Zufällige Stichproben
Lösung:
(keine)
Zufall bedeutet, dass jedes Element der Grundversammlung die gleiche Chance hat,
Dies zeigt, daß keine dieser Stichproben zufällig vorkommt.
Es ist daher auch nicht zu vermuten, dass sie für die Menge aller Anästesien repräsentativ sind. 1: Oberärzte führen schwieriger Operationen durch als beispielsweise AIP-Patienten. 2: Damit könnten Familienmitglieder mit demselben Namen oder auch Patienten aus bestimmten Ländern übermäßig häufig vertreten sein. 3: Hier ist zu berücksichtigen, dass bei einigen Menschen das Geburtsdatum nicht bekannt ist und in den letzten Wochen oft der 1. Monat eingetragen wird. 4: Allgemeine Chirurgie ist eine Klinik und nicht repräsentativ für alle operativen Fachgebiete. 5: Eine bestimmte Altersgruppe kann für alle Patienten sehr unrepräsentativ sein.
Aufgabe 10.2:
Repräsentative Stichprobe
Lösung:
(Nein)
Erstens: Ob eine Stichprobe repräsentativ ist, hängt nicht von ihrer Größe oder ihren Merkmalen ab. A, B und D sind also falsch. Dass die Teilnahme freiwillig stattfand, ist kein Hinweis auf Repräsentativität (Antwort C). Man muss in jedem Fall nachfragen, warum mindestens 40 Patienten ihren Bogen nicht ausgefüllt haben. Dies könnte damit zusammenhängen, dass sie Schwierigkeiten mit dem operierten Finger haben und die Hälfte nicht schreiben können.
Aufgabe 10.3:
Versuchsplanung
Lösung:
(vor der Erhebung)
Man sollte so früh wie möglich darüber nachdenken, welche
Analysemethoden, die angewandt wurden.
Es ist jedoch zu früh, die Fragen zu formulieren (Antwort A):
Wenn man sich mit dem Problem beschäftigen möchte, muss man zunächst alle Merkmale kennen, die man auswerten möchte und diese werden erst aus der Frage ergeben. Die gewählten Verfahren ergeben die gewünschten Stichproben und damit wichtige Informationen für den weiteren Ablauf der Studie.
10 Grundlagen der Versuchsplanung
Aufgabe 10.4:
Systematische Fehler
Lösung:
(große Stichproben)
Große Stichproben tragen dazu bei, dass die
zufällig
Verringerung von Fehlern; repräsentative
Es ist wichtig, daß die Mitgliedstaaten die Möglichkeit haben, die Daten zu erfassen, um die Daten zu überwachen und zu erfassen.
Es ist wichtig, dass zwei Proben strukturell gleich sind (andernfalls würde man Äpfel mit Birnen verwenden).
Ein unpassendes Modell (Antwort C) kann
Problem 10.5: Zufallsfehler Lösung: (nur 13) Je kleiner der Stichprobenumfang ist und je mehr die Messwerte variieren, desto größer wird der zufällige Fehler (der Standardfehler des Mittelwerts; siehe Seite 267).
Entschuldigung, zu Punkten 4 und 5:
Nicht-repräsentative und fehlerhafte Stichproben
Messungen sind für den systematischen Fehler verantwortlich. Aufgabe 10.6: Blockbildung Lösung: (nur 2 und 3) Richtig: Durch die Blockbildung wird der zufällige Fehler innerhalb eines Blocks reduziert (weil die Einheiten des Blocks weitgehend gleich sind).
Gleiches Maß
In den beiden Gruppen) wird die Blockbildung nicht beeinflusst.
Dies ist nicht der Fall, wenn man sich in der Vergangenheit mit einem
Auf diese Weise reduziert sich auch der gesammelte Versuchsfehler, der sich aus dem zufälligen und systematischen Fehler zusammensetzt. Es ist klar, dass die Unterschiede zwischen den Schichten deutlicher werden.
Aufgabe 10.8:
Anzahl der Schichten
Lösung:
(30)
Dies ist leicht zu berechnen, indem man die Anzahl der Merkmalen oder Klassen multipliziert: Status der Krankheit und Geschlecht der Altersgruppe.
Aufgabe 10.9:
Behandlungsgruppenzuordnungen
Lösung:
(Wirbeln)
Alles andere wäre eine Zuteilung nach einem bestimmten System und daher nicht fällig, auch wenn dies auf den ersten Blick nicht erkennbar ist. Sowohl die Patienten als auch der behandelnde Arzt können subjektiven Einfluss auf die Wahl der Behandlungsgruppe haben (B und C). Wenn man jemanden bittet, eine Zahl zwischen 1 und 8 zu wählen, wird erfahrungsgemäß die 7 am häufigsten genannt (D).
Auch systematische Alternationen können nicht gewährleisten, dass die Zuteilung zufällig erfolgt.
Aufgabe 10.10: Doppelblindstudien Lösung: (Datenschutz nicht gewährleistet) Studien werden doppelt blind durchgeführt, um Autosuggestion (D und E) zu vermeiden. Dies trägt zur Einheitlichkeit der Beobachtung und damit zur Vermeidung systematischer Fehler bei (B und A) bei. Dies hat jedoch nichts mit Datenschutz zu tun.
11 Studientypen
Studientypen
Aufgabe 11.1:
Studie über OP-Risiken In einer Klinik sollen die Häufigkeit von Komplikationen bei Operationen und ihre möglichen Ursachen untersucht werden, wobei alle Anästhesieprotokolle aus den vergangenen 12 Monaten als Grundlage eingesetzt werden.
Retrospektive Studie
Progressive Studie
klinisch kontrollierte Studie
Kohortenstudie
Experiment
Aufgabe 11.2:
Fallkontrollstudien
Welche Aussage über Fallkontrollstudien ist richtig? Es handelt sich um prospektive Studien. Die Zahl der Fälle muss immer gleich sein wie die Anzahl der Kontrollen. Diese Studien dienen in der Regel zur Klärung etiologischer Faktoren. Es besteht die Notwendigkeit, Patienten mehrfach zu untersuchen.
Die Matched-Pairs-Technik dient der Beobachtungsgleichheit. Aufgabe 11.3: Retrospektive Studien Welche möglichen Nachteile haben retrospektive Studien? schlechte Datenqualität hat keinen Einfluss auf die Auswahl der Beobachtungseinheiten mit erhöhter Zeitbedarf im Vergleich zu prospektiven Studien meist wesentlich höheren Kosten als in prospektiven Studien. Sie sind nicht geeignet, kausalen Zusammenhänge zu beweisen 15 sind richtig nur 13 sind richtig nur 1 und 2 sind richtig nur 1, 2 und 5 sind richtig nur 1 ist richtig 11 Studientypen Aufgabe 11.4: Matched-Pairs-Technik Warum wird die Matched-Pairs-Technik bei einigen Fallkontrollstudien angewendet?
Um gleich große Gruppen zu erhalten. Um Strukturgleichheit zu erreichen. Um Beobachtungsgleichheit zu erreichen. Um Störgrößen auszuschalten. Um zufällige Fehler zu reduzieren.
Die Kommission ist der Auffassung, daß die
-Fehler ist kontrollierbar.
auf die Kontrollgruppe
die Umfang der Behandlungsgruppen kontrolliert werden kann.
Erfolg der Therapie wird je nach Behandlungsform bewertet.
kann
Die Ausprägung der Wirkungsgrößen (d. h. der Behandlungsform)
kann vorgegeben werden
Aufgabe 11.6:
Aussichtliche Studien
Welche Aussage ist zutreffend
nicht
In einer prospektiven Studie
Sie werden oft von einer Gruppe von Exponenten und einer Gruppe von
Nicht-
Exponenten aus
Man muss in der Regel länger warten, bis die Zielergebnisse eintreten.
Es handelt sich um eine Beobachtungsstudie.
Die Ausdrücke der Einflussfaktoren werden vom behandelnden Arzt bestimmt.
Stimmt
Der Versuchsleiter hat Einfluss auf die Datenerfassung und die vollständige und
ordnungsgemäße Dokumentation der Daten
Aufgabe 11.7:
Klinisch kontrollierte Studien Eigenschaften
Welche Aussage gibt es über randomisierte, klinische Therapiestudien?
nicht
Eine zweite Blindheit ist unbedingt notwendig. Struktur- und Beobachtungsgleichheit sind unbedingt notwendig. Kein Patient darf gezwungen werden, an einer solchen Studie teilzunehmen. Die Randomisierung dient der Strukturgleichheit. Sie kommt in ihrer wissenschaftlichen Ausdrucksweise einem Experiment nahe.
11 Studientypen
Aufgabe 11.8:
Klinisch kontrollierte Studien Verfahren
Im Rahmen einer klinischen Therapiestudie soll ein neu entwickeltes
Es ist jedoch nicht möglich, die Methode zu prüfen, die die herkömmliche Standardtherapie ermittelt.
Sie geben den Patienten zufällig eine der Therapien N oder S zu und behandeln beide Gruppen gleichzeitig in zwei verschiedenen Krankenhäusern. Sie behandeln nur eine Gruppe mit N und vergleichen sie dann mit einer Gruppe, die in der Vergangenheit mit S behandelt wurde.
Um Risiken zu vermeiden, werden leicht erkrankte Patienten mit
N und die schwereren Fälle mit S (zur gleichen Zeit, in derselben Einrichtung). Patienten werden zufällig einer der Therapien N oder S zugeteilt. Beide Gruppen werden gleichzeitig und von demselben Personal behandelt und betreut. Patienten lassen sich entscheiden, ob sie mit N oder S behandelt werden wollen.
Aufgabe 11.9:
Vergleiche in retrospektiver Hinsicht und
Progressive Studie
Es soll untersucht werden, ob die Rauchgewohnheiten von schwangeren Frauen
Das ist in der Theorie mit einer
Nach der Veröffentlichung
Das Ergebnis ist, daß die Zahl der Personen, die
falsch
Eine retrospektive Studie basiert auf einer Gruppe von Müttern mit
Frühgebo-
Kinder und eine andere Gruppe, deren Babys nach normaler Schwan-
Wenn die Studie prospektiv durchgeführt wird, ist es sinnvoll, eine große Zahl von schwangeren Frauen (z. B. Nichtraucherinnen, schwache, mächtige und starke Raucherinnen) anzuwenden.
Die Daten der retrospektiven Studie können sofort analysiert werden, während
Die Ergebnisse werden für jede Klinik mit dem gleichen statistischen Testverfahren ausgewertet, wobei jeweils festgestellt wird. Nur bei einer einzigen XY-Klinik konnte ein deutlicher Unterschied nachgewiesen werden. Danach veröffentlicht die Unternehmensleitung einen Fachbericht mit den Ergebnissen der XY-Klinik und schreibt: Die schmerzstillende Wirkung unseres neu entwickelten Präparats wurde in einer Studie in der XY-Klinik nachgewiesen (Wie bewertet Sie diese Verfahren?
11 Studientypen
Dies ist korrekt, weil nur die Ergebnisse der Klinik XY veröffentlicht werden. Dies ist korrekt, weil der Fehler angegeben wurde. Das kann nur beurteilt werden, wenn man den ganzen Artikel gelesen hat. Dieses Verfahren ist abzulehnen, weil es nicht verantwortungsvoll ist, gegen ein Placebo zu testen.
11 Studienarten Aufgabe 11.1: Studie über OP-Risiken Lösung: (retrospektiv) Die relevanten Ereignisse sind in der Vergangenheit geschehen und werden nachher analysiert. Dies ist das Zeichen einer retrospektiven Studie (siehe Seite 269).
Aufgabe 11.2:
Fallkontrollstudien
Lösung:
(für die Klärung von Ätiologischen Faktoren)
Sie gehen von einer Gruppe von kranken Personen (Fälle) und einer Gruppe
Nicht-er-
Es ist wichtig, die Krankheit zu untersuchen und die möglichen Ursachen für diese Krankheit zu identifizieren.
Es handelt sich um eine retrospektive Studie (A ist falsch); die Zahl der Fälle muss nicht unbedingt mit der Anzahl der Kontrollen übereinstimmen; oft steht eine Kontrollgruppe zur Verfügung, die viel größer ist als die Gruppe der Fälle (B ist falsch).
Patienten müssen nicht untersucht werden, da die relevanten
(D ist falsch)
Matched-Pair-Technik angewendet
1. 2 und 5. Da die Ereignisse in dieser Art der Studie bereits stattgefunden haben, müssen man auf alte Dokumente zurückgreifen oder Patienten befragen. Man kann nicht unbedingt sicher sein, dass alle Daten korrekt und vollständig dokumentiert sind oder dass bei Fragen richtige Antworten erhalten werden.
Dazu sind sie geeignet.
Problem 11.4: Matched-Pair-Technik-Lösung: (Strukturähnlichkeit) Man sucht in jedem Fall eine geeignete Kontrolle (siehe Seite 274). Damit wird festgestellt, dass die beiden Gruppen in wichtigen Einflussgrößen ähnlich sind (Strukturähnlichkeit). Es wird auch erreicht, dass die beiden Gruppen gleich sind aber dies ist ein Nebeneffekt und nicht der eigentliche Sinn dieser Technik (das könnte man auch aus reicheren Gründen reduzieren). A ist also falsch.
Aufgabe 11.5:
Kontrollierte klinische Therapie-Studie
Lösung:
(Influßgrößen können kontrolliert werden)
Eine klinische Studie ähnelt hierbei einem Experiment, bei dem die Einflussgrößen auch vom Forschungsleiter angegeben werden (man spricht dann von kontrollierten Bedingungen). Der wesentliche Unterschied zu einem Experiment besteht darin, dass das Wohl des Patienten an erster Stelle steht und daher wenn nötig der behandelnde Arzt modifizierend eingreifen kann.
Aufgabe 11.6:
Aussichtliche Studien
Lösung:
(ist
falsch
Typisch ist die Situation, die unter A beschrieben wird: Sie gehen von einem Kollektiv von gesunden Personen (exponenten und nichtexponenten) aus und warten, bis eine bestimmte Krankheit auftritt. Dies dauert oft lange (B ist richtig), wobei die Personen nur beobachtet werden; d.h. keine Ausdrücke angegeben werden (C richtig, D falsch).
Das Vorteil ist, dass der Versuchsleiter in der Lage ist, vollständige und korrekte Daten zu erhalten (E, im Gegensatz zu einer retrospektiven Studie). Aufgabe 11.7: Klinisch kontrollierte Studien Eigenschaften Lösung: (Doppelblindheit ist nicht erforderlich) Doppelblindheit ist zwar wünschenswert, aber nicht immer realisierbar (z. B. bei chirurgischen Eingriffe). Alles andere (Antworten BE) ist richtig. Strukturgleichheit und Beobachtungsgleichheit sind immer erforderlich, wenn mehrere Gruppen verglichen werden. Siehe auch Seite 275ff.
Aufgabe 11.8:
Klinisch kontrollierte Studien Verfahren
Lösung:
Nur bei diesem Verfahren ist Beobachtungs- und Strukturgleichheit möglich.
A (verschiedene Kliniken) würde keine Gleichheit der Beobachtungen geben.
B, weil die Zeit als Störgröße hier die Ergebnisse möglicherweise verzerren könnte. Diese Verzerrung kann nur unter ganz bestimmten Bedingungen angewendet werden (z. B. wenn ein neues Medikament untersucht wird, das lebensrettig ist und für das keine Alternative existiert). Der Vorschlag unter C würde zu sehr verzerrten Ergebnissen führen, die nicht einmal 11 Studientypen sinnvoll interpretiert werden können. Auch das Verfahren unter E ist nicht zufällig und daher abzulehnen.
Aufgabe 11.9:
Vergleiche in retrospektiver Hinsicht und
Progressive Studie
Lösung:
(Kausalischer Zusammenhang kann nicht nachgewiesen werden)
Es ist jedoch möglich, einen Zusammenhang zu beweisen.
Eine frühe Geburt, die durch die Rauchgewohnheiten der Mütter verursacht wird, kann mit einer
Es gibt jedoch keine Antwort auf eine retrospektive Studie.
Progressive Studie kann
Es ist jedoch nicht möglich, einen kausalen Zusammenhang zu belegen.
Sie hat jedoch eine wissenschaftlich höhere Ausdrucksfähigkeit als eine
Retrospektive Studie. Aufgabe 11.10: Letzte Aufgabe Lösung: (Betrug) Dieses Verfahren ist wissenschaftlich sehr unbedeutend. Nicht etwa, weil es mit einem Placebo verglichen wird (eine Placebo-Studie kann durchaus gerechtfertigt und ethisch vertretbar sein), sondern weil bei 10-malen Tests die Wahrscheinlichkeit, unter der Nullhypothese eine falsche Entscheidung zu treffen, sehr groß ist (der Fehler Art 1 beträgt nicht 0,05, sondern).
Errata im Buch
Errata im Buch
Die Kommission ist der Auffassung, daß es sich bei der Verwirklichung des Binnenmarktes um eine
Es handelt sich vor allem um die letzte Phase der Erstellung.
Wenn ich alles durchgelesen habe,
über
Der Leser kann sich entschuldigen und die entsprechenden Stellen in seinem Buch korrigieren. Kapitel 3, Seite 54: Die Indizes vom Summenzeichen in Formel (3.20) reichen von 1 bis (hier ist die Klassenzahl) und nicht bis (hier wäre die Stichprobe).
Kapitel 4, Seite 77:
Der letzte Termin in Formel (4.6) ist falsch.
Kapitel 5, Seite 118:
Die Formel (5.30) sollte richtig sein:
Was ist das?
Kapitel 9, Seite 224
Wilcoxon-Test für eine Stichprobe:
Ganz oben: Nicht die
Messwerte
Sie werden nach ihrer Größe sortiert.
Entfernungsbeträge
Dieser Test funktioniert ähnlich wie der
Wilcoxon-Test für 2
Verknüpfte Proben; siehe Beispiel 9.5 auf Seite 226, Kapitel 11, Seite 266 Zufällige Fehler: In Abschnitt 10.4.2 wurden die Begriffe intraindividuell und interindividuell ausgetauscht.