Fehler beim Testen von Hypothesen
Fehler 1. und 2. Art verstehen, berechnen und im Kontext interpretieren.
Warum machen Tests Fehler?
Ein Hypothesentest basiert auf einer Stichprobe, nicht auf der gesamten Grundgesamtheit. Daher kann er zu falschen Schlüssen führen – auch wenn alles richtig gemacht wird!
🎯 Die zwei möglichen Fehler
Fehler 1. Art (α-Fehler)
H₀ wird abgelehnt, obwohl H₀ wahr ist.
„Falscher Alarm"
Fehler 2. Art (β-Fehler)
H₀ wird nicht abgelehnt, obwohl H₀ falsch ist.
„Verpasster Treffer"
Fehler 1. Art (α-Fehler)
Definition
Der Fehler 1. Art tritt auf, wenn H₀ abgelehnt wird, obwohl H₀ in Wirklichkeit wahr ist.
🔑 Wichtige Eigenschaften
- • α ist das Signifikanzniveau (z.B. 5% oder 1%)
- • α wird vor dem Test festgelegt
- • α ist die maximal tolerierte Wahrscheinlichkeit für diesen Fehler
- • Je kleiner α, desto schwerer ist es, H₀ abzulehnen
📝 Beispiel
Situation: Eine Maschine produziert normalerweise höchstens 5% Ausschuss. Wir testen, ob die Ausschussquote gestiegen ist.
Fehler 1. Art: Wir schließen, dass die Quote gestiegen ist (H₀ ablehnen), obwohl sie tatsächlich noch bei 5% liegt. Die Maschine wird unnötig repariert.
→ Unnötige Kosten, falscher Alarm
Fehler 2. Art (β-Fehler)
Definition
Der Fehler 2. Art tritt auf, wenn H₀ nicht abgelehnt wird, obwohl H₀ in Wirklichkeit falsch ist.
🔑 Wichtige Eigenschaften
- • β hängt davon ab, wie falsch H₀ ist (vom wahren Wert p₁)
- • β kann meist nur berechnet werden, wenn der wahre Wert bekannt ist
- • Je näher p₁ an p₀, desto größer β (schwerer zu unterscheiden)
- • 1 - β heißt Macht (Power) des Tests
📝 Beispiel
Situation: Die Ausschussquote ist tatsächlich auf 10% gestiegen.
Fehler 2. Art: Wir schließen, dass die Quote noch OK ist (H₀ nicht ablehnen), obwohl sie in Wirklichkeit gestiegen ist. Das Problem wird nicht erkannt.
→ Problem bleibt unentdeckt, weitere Fehler entstehen
Berechnung des β-Fehlers
📐 Vorgehensweise
Um β zu berechnen, muss man wissen, was der wahre Wert p₁ ist (unter H₁). Dann berechnet man die Wahrscheinlichkeit, dass X im Annahmebereich liegt – aber unter der Verteilung mit p₁.
Formel für rechtsseitigen Test
Annahmebereich: {0, 1, ..., k-1}, Ablehnungsbereich: {k, ..., n}
= Wahrscheinlichkeit, im Annahmebereich zu landen, obwohl p = p₁
📝 Rechenbeispiel
Situation: n = 50, p₀ = 0,1, α = 5%, rechtsseitiger Test
Kritischer Wert: k = 10 (H₀ ablehnen wenn X ≥ 10)
Frage: Wie groß ist β, wenn der wahre Anteil p₁ = 0,2 ist?
β(0,2) = P(X ≤ 9 | p = 0,2) = PB(50; 0,2)(X ≤ 9)
Mit GTR/Tabelle: ≈ 0,444 = 44,4%
Interpretation: Selbst wenn der wahre Anteil 20% ist (doppelt so hoch wie behauptet), wird der Test in 44,4% der Fälle das Problem nicht erkennen!
Zusammenhang zwischen α und β
⚖️ Das Dilemma
α und β sind gegenläufig: Wenn man α verkleinert, wird β größer – und umgekehrt!
α verkleinern
- • Ablehnungsbereich wird kleiner
- • Schwerer H₀ abzulehnen
- • Weniger Fehler 1. Art
- • Aber: Mehr Fehler 2. Art (β↑)
β verkleinern
- • Ablehnungsbereich wird größer
- • Leichter H₀ abzulehnen
- • Weniger Fehler 2. Art
- • Aber: Mehr Fehler 1. Art (α↑)
💡 Lösung: Stichprobengröße erhöhen
Der einzige Weg, sowohl α als auch β gleichzeitig zu verkleinern, ist eine größere Stichprobe n zu wählen!
Mit mehr Daten kann der Test präziser entscheiden.
Praktische Bedeutung
🔴 Wann ist α-Fehler schlimmer?
- • Gerichtsverfahren: Unschuldige verurteilen (H₀: unschuldig)
- • Medizin: Gesunde als krank behandeln
- • Qualitätskontrolle: Gute Charge ablehnen → unnötige Kosten
→ In diesen Fällen wählt man ein kleines α (z.B. 1%)
🔵 Wann ist β-Fehler schlimmer?
- • Medizin: Kranken nicht erkennen → Krankheit verschlimmert sich
- • Sicherheitsprüfung: Defekt nicht erkennen → Unfall
- • Epidemiologie: Ausbruch nicht erkennen → Epidemie
→ In diesen Fällen will man ein kleines β, also α etwas größer wählen
📊 Übersicht: Typische Werte
| Bereich | Typisches α | Begründung |
|---|---|---|
| Physik/Teilchen | 0,0000003 (5σ) | Sehr hohe Sicherheit nötig |
| Medizin | 0,05 oder 0,01 | Kompromiss aus Sicherheit & Praktikabilität |
| Sozialwiss. | 0,05 | Standard in vielen Bereichen |
| Marketing | 0,10 | Schnelle Entscheidungen, Fehler weniger kritisch |
Übungsaufgaben
Zusammenfassung
📝 Übersicht Fehlerarten
| Fehler | Beschreibung | Wahrscheinlichkeit | Kontrolle |
|---|---|---|---|
| 1. Art (α) | H₀ ablehnen, obwohl wahr | α (Signifikanzniveau) | Direkt wählbar |
| 2. Art (β) | H₀ nicht ablehnen, obwohl falsch | β (hängt von p₁ ab) | Indirekt (über n) |
⚠️ Merke
- • α und β sind gegenläufig
- • Nur n erhöhen senkt beide
- • 1 - β = Macht des Tests
✓ Typische Werte
- • α = 5% (Standard)
- • α = 1% (strenger)
- • Macht ≥ 80% angestrebt