Grundlagen der Hauptkomponentenanalyse


Grundlagen der Hauptkomponentenanalyse


1. Ablauf einer Hauptkomponentenanalyse

Veranschaulichen Sie den Ablauf einer Hauptkomponentenanalyse am Beispiel von zwei standardisierten Variablen, indem sie sukzessiv die einzelnen Schritte unter der Überschrift Darstellung Hauptkomponentenanalyse im Menü aktiveren. Stellen Sie zuvor die Standardeinstellungen der Simulation wieder her, indem Sie die Seite neu laden und wählen Sie für die Anzahl der zu ermittelnden Komponenten den Wert 2. Was können Sie beobachten?


Im ersten Schritt erfolgt die Bestimmung der ersten Hauptkomponente, welche die maximal mögliche Varianz der beiden Ausgangsvariablen erklären soll. Diese Komponente verläuft somit direkt durch die Punktwolke. Die zweite Komponente verläuft orthogonal zur ersten Komponente durch den Koordinatenursprung. Nun erfolgt im zweiten Schritt eine Rotation des Koordinatensystems. Die erste Komponente bildet die x-Achse des neuen Koordinatensystems und die zweite Komponente bildet die y-Achse.



2. Ergebnisse einer Hauptkomponentenanalyse

Betrachten Sie nun die Ergebnisse der Hauptkomponentenanalyse. Was vermuten Sie, welche Bedeutung die Faktorladungen besitzen?


Die Faktorladungen entsprechen den Korrelationen zwischen den Ausgangsvariablen und den ermittelten Komponenten.



Informieren Sie sich außerdem über die Bedeutung der Eigenwerte der ermittelten Komponenten und der Kommunalitäten der Variablen. Welche Veränderungen erwarten Sie, wenn nur eine Komponente ermittelt wird? Überprüfen Sie Ihre Annahmen durch Auswahl des Wertes 1 für die Anzahl der Komponenten im Menü.


Die Faktorladungen der ersten Komponente sowie deren Eigenwert verändern sich nicht. Die Kommunalitäten beider Variablen sinken. Die Gesamtvarianzaufklärung ist geringer.



3. Einfluss der Korrelation der Variablen auf die Ergebnisse der Hauptkomponentenanalyse

Wählen Sie für die Anzahl der zu ermittelnden Komponenten erneut den Wert 2 und verändern Sie die Korrelation der Ausgangsvariablen. Welche Veränderungen beobachten Sie?


Je höher die Korrelation der beiden Ausgangsvariablen ist, desto größer ist der Eigenwert der ersten Komponente. Dies wird auch in der Abbildung des rotierten Streudiagramms deutlich. Je höher die Korrelation der Ausgangsvariablen ist, desto deutlicher ist erkennbar, dass die Varianz in der ersten Komponente größer ist als die Varianz in der zweiten Komponente.



4. Neue Datenpunkte

Durch Anklicken des Streudiagramms der Ausgangsvariablen in der oberen linken Abbildung können Sie dieser zusätzliche orange markierte Datenpunkte hinzufügen. Diese Punkte erscheinen automatisch auch an der entsprechenden Stelle im Koordinatensystem der Hauptkomponenten. Die Ergebnisse der Hauptkomponentenanalyse basieren jedoch auf dem ursprünglichen Datensatz und werden somit durch das Hinzufügen neuer Datenpunkte nicht verändert. Stellen Sie die Korrelation der Variablen zurück auf die Standardeinstellung von 0.5 und fügen Sie der Abbildung beispielhaft einen Punkt P (Variable 1 = 2 ; Variable 2 = 1) hinzu. An welcher Stelle erscheint dieser Punkt im rotierten Koordinatensystem?


Der Punkt P besitzt in der ersten Komponente einen Wert von rund 2 und in der zweiten Komponente einen Wert von rund -0.5.