Fehler beim Testen von Hypothesen

Fehler 1. und 2. Art verstehen, berechnen und im Kontext interpretieren.

🧠

Warum machen Tests Fehler?

Ein Hypothesentest basiert auf einer Stichprobe, nicht auf der gesamten Grundgesamtheit. Daher kann er zu falschen Schlüssen führen – auch wenn alles richtig gemacht wird!

🎯 Die zwei möglichen Fehler

Fehler 1. Art (α-Fehler)

H₀ wird abgelehnt, obwohl H₀ wahr ist.

„Falscher Alarm"

Fehler 2. Art (β-Fehler)

H₀ wird nicht abgelehnt, obwohl H₀ falsch ist.

„Verpasster Treffer"

✓ RichtigFehler 1. Art(α-Fehler)Fehler 2. Art(β-Fehler)✓ RichtigH₀ wahrH₀ falschH₀ nichtabgelehntH₀abgelehntEntscheidungsmatrix
📘

Fehler 1. Art (α-Fehler)

Definition

Der Fehler 1. Art tritt auf, wenn H₀ abgelehnt wird, obwohl H₀ in Wirklichkeit wahr ist.

🔑 Wichtige Eigenschaften

  • • α ist das Signifikanzniveau (z.B. 5% oder 1%)
  • • α wird vor dem Test festgelegt
  • • α ist die maximal tolerierte Wahrscheinlichkeit für diesen Fehler
  • • Je kleiner α, desto schwerer ist es, H₀ abzulehnen

📝 Beispiel

Situation: Eine Maschine produziert normalerweise höchstens 5% Ausschuss. Wir testen, ob die Ausschussquote gestiegen ist.

Fehler 1. Art: Wir schließen, dass die Quote gestiegen ist (H₀ ablehnen), obwohl sie tatsächlich noch bei 5% liegt. Die Maschine wird unnötig repariert.

→ Unnötige Kosten, falscher Alarm

📘

Fehler 2. Art (β-Fehler)

Definition

Der Fehler 2. Art tritt auf, wenn H₀ nicht abgelehnt wird, obwohl H₀ in Wirklichkeit falsch ist.

🔑 Wichtige Eigenschaften

  • • β hängt davon ab, wie falsch H₀ ist (vom wahren Wert p₁)
  • • β kann meist nur berechnet werden, wenn der wahre Wert bekannt ist
  • • Je näher p₁ an p₀, desto größer β (schwerer zu unterscheiden)
  • 1 - β heißt Macht (Power) des Tests

📝 Beispiel

Situation: Die Ausschussquote ist tatsächlich auf 10% gestiegen.

Fehler 2. Art: Wir schließen, dass die Quote noch OK ist (H₀ nicht ablehnen), obwohl sie in Wirklichkeit gestiegen ist. Das Problem wird nicht erkannt.

→ Problem bleibt unentdeckt, weitere Fehler entstehen

🧩

Berechnung des β-Fehlers

📐 Vorgehensweise

Um β zu berechnen, muss man wissen, was der wahre Wert p₁ ist (unter H₁). Dann berechnet man die Wahrscheinlichkeit, dass X im Annahmebereich liegt – aber unter der Verteilung mit p₁.

Formel für rechtsseitigen Test

Annahmebereich: {0, 1, ..., k-1}, Ablehnungsbereich: {k, ..., n}

= Wahrscheinlichkeit, im Annahmebereich zu landen, obwohl p = p₁

📝 Rechenbeispiel

Situation: n = 50, p₀ = 0,1, α = 5%, rechtsseitiger Test
Kritischer Wert: k = 10 (H₀ ablehnen wenn X ≥ 10)

Frage: Wie groß ist β, wenn der wahre Anteil p₁ = 0,2 ist?

β(0,2) = P(X ≤ 9 | p = 0,2) = PB(50; 0,2)(X ≤ 9)

Mit GTR/Tabelle: ≈ 0,444 = 44,4%

Interpretation: Selbst wenn der wahre Anteil 20% ist (doppelt so hoch wie behauptet), wird der Test in 44,4% der Fälle das Problem nicht erkennen!

📘

Zusammenhang zwischen α und β

⚖️ Das Dilemma

α und β sind gegenläufig: Wenn man α verkleinert, wird β größer – und umgekehrt!

α ↓β ↑Kleineres α → Größeres β

α verkleinern

  • • Ablehnungsbereich wird kleiner
  • • Schwerer H₀ abzulehnen
  • • Weniger Fehler 1. Art
  • Aber: Mehr Fehler 2. Art (β↑)

β verkleinern

  • • Ablehnungsbereich wird größer
  • • Leichter H₀ abzulehnen
  • • Weniger Fehler 2. Art
  • Aber: Mehr Fehler 1. Art (α↑)

💡 Lösung: Stichprobengröße erhöhen

Der einzige Weg, sowohl α als auch β gleichzeitig zu verkleinern, ist eine größere Stichprobe n zu wählen!

Mit mehr Daten kann der Test präziser entscheiden.

🧩

Praktische Bedeutung

🔴 Wann ist α-Fehler schlimmer?

  • Gerichtsverfahren: Unschuldige verurteilen (H₀: unschuldig)
  • Medizin: Gesunde als krank behandeln
  • Qualitätskontrolle: Gute Charge ablehnen → unnötige Kosten

→ In diesen Fällen wählt man ein kleines α (z.B. 1%)

🔵 Wann ist β-Fehler schlimmer?

  • Medizin: Kranken nicht erkennen → Krankheit verschlimmert sich
  • Sicherheitsprüfung: Defekt nicht erkennen → Unfall
  • Epidemiologie: Ausbruch nicht erkennen → Epidemie

→ In diesen Fällen will man ein kleines β, also α etwas größer wählen

📊 Übersicht: Typische Werte

BereichTypisches αBegründung
Physik/Teilchen0,0000003 (5σ)Sehr hohe Sicherheit nötig
Medizin0,05 oder 0,01Kompromiss aus Sicherheit & Praktikabilität
Sozialwiss.0,05Standard in vielen Bereichen
Marketing0,10Schnelle Entscheidungen, Fehler weniger kritisch
💡

Übungsaufgaben

📘

Zusammenfassung

📝 Übersicht Fehlerarten

FehlerBeschreibungWahrscheinlichkeitKontrolle
1. Art (α)H₀ ablehnen, obwohl wahrα (Signifikanzniveau)Direkt wählbar
2. Art (β)H₀ nicht ablehnen, obwohl falschβ (hängt von p₁ ab)Indirekt (über n)

⚠️ Merke

  • • α und β sind gegenläufig
  • • Nur n erhöhen senkt beide
  • • 1 - β = Macht des Tests

✓ Typische Werte

  • • α = 5% (Standard)
  • • α = 1% (strenger)
  • • Macht ≥ 80% angestrebt