Lambda #
Lambda ist ein sogenannten PRE-Maß. PRE steht für „proportional reduction of error“, also proportionale Reduktion des Fehler (Behnke 2010: 393). PRE-Maß geben an, wie groß der Anteil des Fehlers bei der Schätzung der abhängigen Variablen ist, um den er durch das Wissen um den Wert der unabhängigen Variable verglichen wird (Behnke 2010: 393). Anders gesagt: PRE-Maße vergleichen, um wie viel genauer die Schätzung eines Wertes wird, wenn man die unabhängige Variable X kennt.
Lambda ist ein asymmetrisches Zusammenhangsmaß für nominalskalierte Merkmale. Unabhängige und abhängige Variable können also nicht, wie es zum Beispiel bei PHI und Cramérs V der Fall ist, folgenlos miteinander vertauscht werden. Die Formel für die Berechnung von Lambda ist die folgende:
$$\lambda = \frac{E_1 - E_2}{E_1}$$
E1 ist der Schätzer mit der geringsten Fehlerquote ohne Einbeziehung der unabhängigen Variable. Um ihn zu berechnen, ziehst du von n alle Zeilensummen ab, die nicht der beste Schätzer, also die kleinste Zahl sind. E2 ist der beste Schätzer unter Einbeziehung der unabhängigen Variable. Dafür addierst du alle Zellenwerte der Spalten, die nicht den höchsten Wert der Spalte enthalten.
Beispielrechnung #
Für die Berechnung von Lambda benötigen wir zunächst eine Kreuztabelle mit absoluten Werten:
X1 | X2 | ||
---|---|---|---|
Y1 | 86 | 27 | 113 |
Y2 | 44 | 92 | 136 |
130 | 119 | 249 |
Für die Ermittlung von E1 ziehst du von n alle Zeilensummen ab, die nicht die größte Zeilensumme darstellen.
$$E_1 = 249 - 113 = 136$$
Für die Ermittlung von E2 summierst du alle Zellenwerte auf, die nicht in ihrer jeweiligen Spalte den höchsten Wert enthalten:
$$E_2 = 44+27 = 71$$
Die so gewonnen Werte kannst du nun in die Formel einsetzen:
$$\lambda = \frac{136 - 71}{136} = 0,48$$
Als Prozentwert dargestellt sind das 48 %. Das Ergebnis lautet also wie folgt: Die Kenntnis der unabhängigen Variable x kann die Vorhersage von y um 48 % verbessern.