Kleinste Fehlerquadrate
Die Regressionsanalyse ist ein weit verbreitetes statistisches Analyseverfahren zur Untersuchung von Beziehungen zwischen einer abhängigen Variablen und einer oder mehreren unabhängigen Variablen. In unserem Fall spielen die individuellen Rangwerte die Rolle der abhängigen Variable, während die Dummy-Variablen xijk die Rolle der unabhängigen Variablen im linearen Regressionsmodell übernehmen. Gesucht sind die Teilnutzenwerte bij, die genau die Koeffizienten im linearen Modell darstellen. Den Ausgangspunkt der Regressionsanalyse bildet dabei wieder das lineare Modell für die Conjoint-Analyse
wobei die Annahme zugrunde gelegt wird, dass die Werte yk Näherungen für die individuellen Rangwerte der Versuchspersonen bilden. In diesem Fall kann mit der Methode der kleinsten Fehlerquadrate eine eindeutig bestimmte Schätzung für die Teilnutzenwerte erfolgen, die dann genau den Regressionskoeffizienten entsprechen.
Berechnung von Regressionskoeffizienten
Die genaue Berechnung der Regressionskoeffizienten soll am Beispiel Pausenriegel für die erste Versuchsperson illustriert werden. Unter Verzicht auf die konstante Größe μ erhält man aus dem linearen Modell folgende Schätzungen für die empirischen Rangfolgewerte:
Tab. 5: Schätzungen für die empirischen Rangfolgewerte
Wie man schnell feststellt, sind aus den acht Gleichungen nur sieben Unbekannte zu berechnen, sodass die klassische Regressionsrechnung tatsächlich ein Ergebnis für die gesuchten Teilnutzenwerte und den Parameter μ liefert. Für die praktische Berechnung der gesuchten Koeffizienten überträgt man die acht Näherungsgleichungen für die Rangfolgeschätzung in eine Tabelle, sodass sich für die erste Versuchsperson (Vpn) die Situation in Tabelle 6 ergibt.
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
Stimulus |
Eigenschaften |
Präferenz |
X11* |
X12* |
X21* |
X22* |
X31* |
X32* |
1 |
A1B1C1 |
6 |
1 |
0 |
1 |
0 |
1 |
0 |
2 |
A1B1C2 |
2 |
1 |
0 |
1 |
0 |
0 |
1 |
3 |
A1B2C1 |
4 |
1 |
0 |
0 |
1 |
1 |
0 |
4 |
A1B2C2 |
1 |
1 |
0 |
0 |
1 |
0 |
1 |
5 |
A2B1C1 |
8 |
0 |
1 |
1 |
0 |
1 |
0 |
6 |
A2B1C2 |
3 |
0 |
1 |
1 |
0 |
0 |
1 |
7 |
A2B2C1 |
7 |
0 |
1 |
0 |
1 |
1 |
0 |
8 |
A2B2C2 |
5 |
0 |
1 |
0 |
1 |
0 |
1 |
Tab. 6: Vollständige Tabelle für die Berechnung der Regressionskoeffizienten
Studiert man die Tabelle 6, so fällt zunächst auf, dass nur die Spalten 3 bis 9 für eine Regressionsanalyse relevant sind, da sie alle notwendigen Daten über die beteiligten unabhängigen und abhängigen Variablen enthalten. Darüber hinaus fällt auf, dass die Spalten 5, 7 und 9, d.h. die den jeweils zweiten Ausprägungen entsprechenden Dummy-Variablen, Redundanzen darstellen, da sich ihre Werte aus den Werten der unmittelbar vorausgehenden Spalte für die erste Ausprägung ergeben. Folglich können bei der Berechnung die Spalten 5, 7 und 9 weggelassen werden, da sie keine zusätzlichen Informationen enthalten. Durch die Eliminierung einiger Dummy-Variablen stimmen die nun aus den Spalten 3, 4, 6 und 8 berechneten Regressionskoeffizienten nicht mehr mit den Teilnutzenwerten überein, da die Koeffizienten der eliminierten Spalten gleich null gesetzt werden.
Regressionskoeffizient
Überträgt man die Spalten 3, 4, 6 und 8 in ein Excel-Blatt (s. Abb. 1), kann man mit Hilfe der in MS-Excel bereitgestellten Regressionsfunktion aus dem Menüpunkt Extras/Analyse-Funktionen die Regressionskoeffizienten ßij (wobei der Y-Eingabebereich der Präferenzspalte und der X-Eingabebereich den restlichen Spalten 4, 6 und 8 entspricht) berechnen (s. Abb. 2). Dann erhält man im Beispiel Pausenriegel für die erste Versuchsperson folgende Ergebnisse:
Tab. 7: Regressionskoeffizienten für Versuchsperson 1
Das Ergebnis aus Tabelle 7 finden Sie auch in der Excel-Datei "Conjoint-Analyse" in dem Arbeitsblatt "Rangregression Vpn 1".
Das heißt:
für k = 1, ... , 8
Abb. 1: Analysebereich in Excel-Tabelle
Individuelle Rangordnung
Nutzt man die Regressionsfunktion von Ecxcel für die erste Versuchsperson zur Schätzung der individuellen Rangordnung für die Stimuli, so erhält man das Ergebnis aus Tabelle 8.
Stimulus |
Eigenschaften |
Präferenz |
X11* |
X21* |
X31* |
Geschätzte Präferenz |
1 |
A1B1C1 |
6 |
1 |
1 |
1 |
5,25 |
2 |
A1B1C2 |
2 |
1 |
1 |
0 |
1,75 |
3 |
A1B2C1 |
4 |
1 |
0 |
1 |
4,75 |
4 |
A1B2C2 |
1 |
1 |
0 |
0 |
1,25 |
5 |
A2B1C1 |
8 |
0 |
1 |
1 |
7,75 |
6 |
A2B1C2 |
3 |
0 |
1 |
0 |
4,25 |
7 |
A2B2C1 |
7 |
0 |
0 |
1 |
7,25 |
8 |
A2B2C2 |
5 |
0 |
0 |
0 |
3,75 |
Tab. 8: Geschätze Rangfolgewerte für Vpn 1
Dabei ergeben sich die drei Nullwerte für die Regressionskoeffizienten der jeweils zweiten Ausprägungen aus der Tatsache, dass die sie betreffenden Spalten bei der Berechnung eliminiert wurden. Das Ergebnis aus Tabelle 8 finden Sie auch in der Excel-Datei "Conjoint-Analyse" in dem Arbeitsblatt "geschätzte Präferenz Vpn 1".
Die gesuchten Teilnutzenwerte bij für die Eigenschaften und ihre Ausprägungen erhält man aus den gefundenen Regressionskoeffizienten ßij durch Transformation:
Abb. 13:
wobei βix den Mittelwert über alle Ausprägungen einer Eigenschaft darstellt. Die Konstante Größe μ, die ebenfalls aus der Regression berechnet wird, besitzt keine praktische Bedeutung. |
Ermittlung von Teilnutzwerten
Für das Beispiel Pausenriegel und die erste Versuchsperson ergeben sich somit unter Verwendung der Transformation folgende Teilnutzenwe...