Wie funktioniert das Ellenbogenkriterium für die Bestimmung der Klassenanzahl einer Clusteranalyse?
Hier ist das was mein Skript dazu sagt.
Bestimmung der Klassenanzahl:
\( \circ \) Verschmelzungsniveaus \( a_{1} \leq a_{2} \leq \ldots \leq a_{n-1} \Rightarrow \) Anzahl der Klassen \( =n-i \) bei Niveau \( a_{i} \) (somit \( a_{1} \) als die Distanz, bei der zum ersten Mal 2 Objekte verschmolzen werden, usw.)
\( \circ \) Ellenbogenkriterium:
Wahl von \( n-i \) Klassen, wenn \( a_{i+1}-a_{i} \) groß im Vergleich zu \( a_{i}-a_{i-1} \) (Zuordnung \( a_{0}=0, \) verbunden mit \( n \) Klassen)
Und hier eine Beispielrechnung dazu wie das Kriterium verwendet wird:
Daten:
1 2 3 4 5 6
2 32.3
3 8.1 30.2
4 37.2 7 35.1
5 13.2 33.1 5.1 38.0
7 16.3 22.6 8.4 27.5 11.5 4.6
Rechnung:
Ellenbogenkriterium:
\( n-i \) Klassen, bei dem kleinsten \( i \) für das gilt \( \alpha_{i+1}-\alpha_{i}>\alpha_{i}-\alpha_{i-1} \)
\( \alpha_{i} \) Distanz, bei der \( n-i+1 \) Klassen zu \( n-i \) Klassen verschmolzen wird:
\( \alpha_{0}=0, \alpha_{1}=4.6, \alpha_{2}=5.1, \alpha_{3}=7, \alpha_{4}=13.1, \alpha_{5}=16.3, \alpha_{6}=38.0 \)
\( \alpha_{1}-\alpha_{0}=4.6 \)
\( \alpha_{2}-\alpha_{1}=0.5 \)
\( \alpha_{3}-\alpha_{2}=1.9 \)
\( \alpha_{4}-\alpha_{3}=4.1 \)
\( \alpha_{5}-\alpha_{4}=3.2 \)
\( \alpha_{6}-\alpha_{5}=21.7 \)
\( \alpha_{3}-\alpha_{2}>\alpha_{2}-\alpha_{1} \)
\( \Rightarrow i=2 \Rightarrow n-i=5 \)
Nach dem Ellenbogenkriterium sollten fünf Klassen verwendet werden
Daten aus "Statistik II - Pr. Dr. Jens Krüger (2013)"