Beitragsseiten

Wie hängen eigentlich Körpergröße und Attraktivität einer Person zusammen? Empfinden wir größere Menschen als attraktiver oder spielt dies keine Rolle? Allgemein heißt es beispielsweise, dass Frauen größere Männer eher attraktiv finden als kleinere, was etwa damit erklärt wird, dass größere Männer bessere Beschützer darstellen sollen und damit Heim und Familie besser verteidigen können. Wir werden uns dieser Frage annehmen und versuchen, Zusammenhänge (aber keine Kausalitäten) aufzuzeigen.

Als Datengrundlage der eigenen Untersuchung dient der ALLBUS 2014, zahlreiche wichtige Informationen enthält. Dort finden wir allgemeine Informationen zu üblichen soziodemographischen Informationen wie Geschlecht, Alter, Einkommen, Religion, Wohnsituation, etc... Auch wurden dort, was für sozialwissenschaftliche Befragungen eher ungewöhnlich ist, Informationen zum BMI erhoben, also Körpergröße und Gewicht. Natürlich sind diese Informationen, besonders die Größe, für uns zentral. Den BMI an sich werden wir nicht benutzen, da wir nicht an Körpertypen, sondern nur an Größen interessiert sind. Dies zeigt auch die Grenzen der Untersuchung auf: sehr große, aber auch sehr übergewichtige Menschen mögen eine niedrige Attraktivität besitzen, dies können wir aber nicht berücksichtigen. Ebenso zentral: ein Maß der Attraktivität. Dazu bewerten die Interviewer die Befragten vor dem Interview auf einer mit 11 Punkten von 1 (unattraktiv) bis 11 (attraktiv). Höhere Werte stehen also für attraktivere Personen. Natürlich muss uns klar sein, dass Attraktivität extrem subjektiv ist und wir keine Information darüber haben, wie die Interviewer zu ihrer Einschätzung gekommen sind. Vermutlich ist es schlichtweg das Bauchgefühl, allein schon deshalb, weil es extrem schwierig wäre, Attraktivität objektiv zu messen (besonders, da die Messung heimlich geschieht und Befragte nicht über das "Ergebnis" informiert werden). Noch ein Disclaimer: diese Analyse ist "data driven" und wird keine große Theoriearbeit leisten. Es handelt sich also eher um eine Darstellung von Analysemöglichkeiten als eine tatsächliche wissenschaftliche Untersuchung.

Da uns wie beschrieben ein breites Band an Informationen vorliegt, werden wir versuchen, diese Einzubeziehen, um unsere Ergebnisse abzusichern. Wir werden also verschiedene Kontrollvariablen einbeziehen, um Scheinkorrelationen zu verhindern. Was bedeutet das? Man könnte beispielsweise annehmen, dass Körpergröße und beruflicher Erfolg korrelieren, etwa, weil größere Personen leistungsfähiger, aber nicht unbedingt attraktiver sind. Somit würden größere Personen mehr verdienen und könnte mehr für ihre Schönheit tun, beispielsweise durch exklusive Kleidung, MakeUp oder im Extremfall gar Schönheitsoperationen. Diese Personen wären am Ende tatsächlich attraktiver, allerdings vermittelt durch den Einfluss des Einkommens. Würde man nicht für das Einkommen kontrollieren, würde man eine Scheinkorrelation zwischen Körpergröße und Attraktivität vorfinden.

Weiterhin werden wir die Analysen aufspalten, um detailliertere Ergebnisse zu erhalten. So ist anzunehmen, dass das Geschlecht ein herausragender Faktor sein dürfte. Wir nehmen etwa an, dass (heterosexuelle) Interviewer stets Personen vom jeweils anderen Geschlecht attraktiver empfinden. Es könnte also ein Zusammenhang zwischen dem Geschlecht des Befragten und dem Geschlecht des Interviewers und dem Ergebnis der Bewertung bestehen. Um dies aufzudecken, werden wir vier Gruppen bilden: Männer die Männer befragen, Männer die Frauen befragen, Frauen die Frauen befragen und Frauen die Männer befragen. Ein weiterer Aspekt ist, dass ein Interviewer jeweils zahlreiche Personen befragt. So wurden insgesamt 181 Interviewer eingesetzt. Das Problem: es könnten signifikante Unterschiede zwischen den Interviewer bestehen. Beispielsweise ist denkbar, dass bestimmte Interviewer besonders kritisch sind und alle Personen niedriger einstufen als andere, die offener sind. Dieses Problem kann durch eine Multilevelanalyse abgemildert werden. Man spricht davon, dass Befragte in Interviewern "genestet" sind. Wir werden daher das Level "Interviewer" einfügen, was unsere Ergebnisse verbessern sollte. Wir haben dann im unseren Modell "fixe" und "zufällige" Effekte. Die Effekte der Kontrollvariablen, wie beispielsweise Einkommen oder Körpergröße sind fix, weil diese allgemeingültig sein sollten. Zufällig sind die Interviewereffekte, also ob beispielsweise manche Interviewer kritischer sind als andere oder gerade einen guten oder schlechten Tag haben. Später werden wir sehen, ob diese Modellierung unsere Ergebnisse verbessert.

 


 

Zunächst werden wir uns deskriptive, also nur beschreibende Statistiken ansehen. Dies ist grundsätzlich vor weiteren Analysen zu empfehlen, um ein Gefühl für die Daten und die Verteilung der zentralen Variablen zu erhalten. Zunächst legen wir unsere Kontrollvariablen fest, um unsere Stichprobe auswählen zu können. Um die Analyse einfach zu halten, werden wir nur für Alter, Bildungslevel und Einkommen kontrollieren, da wir annehmen, dass diese Faktoren signifikant auf die Attraktivität einer Person einwirken. Bildung könnte beispielsweise deshalb wichtig sein, weil höher gebildete Personen einen anderen Geschmack (in Bezug auf Kleidungsstil, Einrichtung, etc...) aufweisen, was die Attraktivität beeinflussen könnte. Das Geschlecht kontrollieren wir implizit durch das Design der Analysen. Wir entfernen alle Personen, die einen oder mehrere fehlende Werte auf eine dieser Variablen aufweisen, aus dem Sample. Am Ende bleiben 2694 Fälle übrig.

histo attra

 

 

 

 

 

 

 

 

 

 

Beginnen wir damit, uns die Verteilung der Attraktivitätsvariable (abhängige Variable) anzusehen. Dazu ist ein Histogram geeignet. Wie wir sehen, nähert sich diese Verteilung grob einer Normalverteilung an. Der Modus ist Kategorie 8, also ein relativ hoher Wert. Offensichtlich ist die Attraktivität der Gesamtbevölkerung relativ hoch. Auch zeigt die Verteilung, dass die meisten der Kategorien ausreichend besetzt sind. Wir können daher die Variable daher als metrisch betrachten, was die Analysen erleichtert. Streng genommen ist die Variable ordinalskaliert, was wir zumindest anmerken sollten.

size

 

 

 

 

 

 

 

 

 

Die zweite zentrale Variable ist die Körpergröße. Da diese in Zentimetern gemessen wird, liegt eine klar metrische Variable vor. Hier trennen wir die Darstellung nach Geschlecht, da wir erhebliche Differenzen erwarten. Tatsächlich erkennt man die Unterschiede klar, die allgemeine Normalverteilungsannährung jedoch auch. Männer sind im Schnitt größer als Frauen. Die Verteilung der übrigen Variablen ist weniger aufregend. Jedoch werden die Variablen zur Verbesserung der Analyse transformiert. Der höchste Schulabschluss wurde in drei Kategorien rekodiert (Hauptschulabschluss oder kein Abschluss, Mittlere Reife, Abitur oder Fachabitur). Das Einkommen ist wie üblich sehr ungleich verteilt, sodass dieses durch den Logarithmus transfomiert wird. Danach nähert sich auch dieses einer Normalverteilung an.

Eine weitere Anmerkung: streng genommen müssten alle Ergebnisse gewichtet werden, da Personen aus Ostdeutschland im ALLBUS planmäßig überrepräsentiert sind. Dies ist immer dann wichtig, wenn wir erwarten würden, dass signifikante Unterschiede zwischen West und Ost bestehen. Problematisch ist, dass unser Multilevelmodell keine Gewichtung erlaubt. Grund ist schlichtweg, dass die Statistiker (noch) nicht wirklich wissen, wie man Multilevelmodelle und Gewichte miteinander kombiniert und richtige Ergebnisse erhält. Deshalb sind grundsätzlich alle Statistiken in dieser Analyse nicht gewichtet, was Verzerrungen verursachen könnte. Ein einfacher t-Test zeigt beispielsweise, dass sich die Körpergröße in West und Ost signifikant unterscheiden: Personen in Westdeutschland sind im Schnitt 1,19 cm größer als Personen aus dem Osten (p = 0,001, n = 2694). In diesem Falle müsste man abwägen, ob einem die Gewichtung oder die Multilevel-Modellierung wichtiger ist. Wir entscheiden uns hier für das Multilevel.

 


 

Kommen wir nun zu den eigentlichen Analysen. Wie bereits beschrieben werden wir vier verschiedene Modelle berechnen, um den Einfluss des Geschlechts angeben zu können. Wir betreiben der Einfachheit halber keinen schrittweisen Modellaufbau, sondern nehmen direkt alle Variablen mit in das Modell. Eine Alternative ist es, zuerst als einzigen Prädiktor die Körpergröße aufzunehmen und anschließend die Kontrollvariablen hinzuzufügen. Um zu testen, ob sich die Modelle unterscheiden, kann anschließend ein Likelihood-Ratio-Test verwendet werden. Im Do-File findet sich ein Beispiel, wie dies angewendet werden kann. Zunächst fassen wir die Ergebnisse knapp in einer einfachen Tabelle zusammen:

tab1

 

 

 

 

 

 

 

 

 

 

 

 

 

Die Interpretation ist wie folgt: positive, signifikante Koeffizienten bedeuten, dass höhere Werte mit höherer Attraktivität einhergehen. Die nominalskalierte Variable Schulabschluss hat als Referenz "Hauptschulabschluss oder kein Abschluss". Insgesamt wird deutlich, dass die Körpergröße nur dann eine Rolle spielt, wenn Frauen Männer interviewen: jeder Zentimeter mehr an Körpergröße erhöht dann die Attraktivität um 0,036 Punkte (unter Konstanthaltung aller anderen Variablen). Der Effekt ist hochsignifikant. Das Fazit lautet also: in den Augen von Frauen ist die Körpergröße bei Männern ein Faktor, der auf die Attraktivität einwirkt und größere Männer sind im Schnitt attraktiver. Die Interpretation der anderen Variablen kann zum Üben von Effekten genutzt werden. Noch ein Beispiel für den Schulabschluss (Männer interviewen Frauen): Personen mit Abitur sind im Vergleich zu Personen mit Hauptschulabschluss im Schnitt 0,71Punkte attraktiver. Bildung macht also doch sexy...

Zur Übung ist die Originalausgabe von Stata für das dritte Modell (Frauen interviewen Männer) angegeben. Hierbei sollen noch kurz einige Dinge angemerkt werden:

output

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Oben rechts sehen wir zunächst N (614) und die Anzahl der Gruppen (78), also die Anzahl der Interviewer. Im Schnitt hat ein Interviewer 7,9 Personen interviewt. Unten sehen wir die Informationen zur Nestingvariable Interviewer (V834). Der LR test (letzte Zeile) ist hochsignifikant (0.0000) was uns zeigt, dass es signifikante Unterschiede zwischen den Interviewern gibt. Die Anwendung eines Multilevelmodels ist daher absolut gerechtfertigt. Die Intraklassenkorrelation ergibt sich aus (0,896^2) / (0,896^2 + 1,377^2) = 0,297 (oder über den Befehl estat icc). Dies bedeutet, dass es durchaus Gemeinsamkeiten innerhalb der Gruppen gibt. Ein Wert von 1 würde bedeuten, dass alle Befragten innerhalb einer Gruppe identisch wären.

Zum Abschluss eine kurze Diagnostik. Bei Regressionen teste man normalerweise, ob die Residuen normalverteilt sind. Ist dieses Kriterium nicht erfüllt, kann es sein, dass wichtige Variablen im Modell fehlen. Erkennt man beispielsweise Muster im Plot der Residuen, so kann es sein, dass ein Interaktionsterm fehlt. Um dies zu testen führen wir (hier im Beispiel nach Modell 3) folgende Befehle aus (siehe Do-File) und erhalten diese Ausgabe:

resids m3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Wie wir feststellen, liegen die Residuen fast perfekt auf einer Geraden, was die approximative Normalverteilung beweist. Dies ist grundsätzlich ein positives Kriterium, was unsere Inferenz absichert.


Zusammenfassend lässt sich sagen, dass sich mit den Daten des ALLBUS 2014 folgende Aussagen treffen lassen: die Körpergröße spielt nur dann einen Einfluss auf die Attraktivität, wenn Männer von Frauen befragt werden. Somit ist nur in dieser Kombination von einem Effekt auszugehen. Dieses Ergebnis ist hochsignifikant unter Kontrolle weiterer wichtiger Variablen wie Einkommen oder Alter. Grundsätzlich muss betont werden, dass damit ein Zusammenhang, jedoch keine Kausalität gezeigt wurde. Die genauen Mechanismen zwischen Körpergröße und Attraktivität müssen genauer untersucht werden. Wir gehen grundsätzlich davon aus, dass diese Erkenntnisse repräsentativ für Deutschland sind, da der ALLBUS ein professionell erhobener Datensatz ist und hohe Gütestandards aufweist. Problematisch ist jedoch, wie bereits erwähnt, dass Personen aus Ostdeutschland in der Analyse überrepräsentiert sind. Eine Möglichkeit, dieses Problem zu umgehen, wäre es, die Analysen getrennt nach Bundesländern aufzuteilen. Sinkende Fallzahlen würde dabei jedoch die Standardfehler vergrößern. Wir müssen also abschätzen, was wir eher in Kauf nehmen möchten.

Anbei findet sich das Stata Do-File, um die Ergebnisse der Untersuchung reproduzieren zu können. Die Originaldaten lassen sich von der Website des ALLBUS kostenlos herunterladen (siehe Artikelanfang).

Do-File (Version 1.0)