Cognitive HR: Big Data in der Personalauswahl

Algorithmen sollen anhand von Big-Data-Auswertungen Persönlichkeitsprofile erkannt und damit die US-Wahl beeinflusst haben. Doch geht das überhaupt – und wenn ja, was heißt das für die Personalarbeit? Ein Überblick zur aktuellen Forschungslage.

Mitte Dezember 2016 sorgte ein Bericht zur Nutzung von Big Data im US-Wahlkampf für Furore. Hintergrund war ein Artikel der Schweizer Zeitschrift "Das Magazin". Titel: "Ich habe nur gezeigt, dass es die Bombe gibt." Damit spielen die Autoren auf den Physiker Robert Oppenheimer an, der gemeinhin als "Vater der Atombombe" gilt.

Und doch ging es um einen anderen Wissenschaftler — nämlich um den Psychologen Michal Kosinski, der hier gewissermaßen als Vater jener Persönlichkeitsprofile vorgestellt wird, mit denen der US-Wahlkampf gezielt beeinflusst worden sein soll.

Big Data als Grundlage für Persönlichkeitsprofile?

Wir wollen nun einen nüchternen Blick auf die Arbeit von Kosinski werfen: Anhand seiner wissenschaftlichen Veröffentlichungen wollen wir zeigen, welche Aussagekraft Persönlichkeitsprofile haben, die auf Grundlage von Nutzerdaten aus den sozialen Netzwerken entstehen. Dabei geht es uns allerdings weniger um den US-Wahlkampf als vielmehr um die Frage, welchen Stellenwert Big Data künftig im Personalmanagement haben könnte und was in diesem Feld überhaupt realistisch ist.

Die Studien von Michal Kosinski

Die Arbeiten von Michal Kosinski und seinen Kollegen beruhen auf einer einmaligen Erhebung von Persönlichkeitsprofilen bei Facebook-Nutzern. Für die Studie haben die Teilnehmer einen Fragebogen beantwortet und der wissenschaftlichen Verwendung ihrer Daten zugestimmt. Je nach Auswertung stützt sich die Studie auf Angaben von bis zu 180.000 Facebook-Nutzern. Obwohl es sich nicht um eine Zufallsstichprobe handelt, dürfte die Repräsentativität trotzdem nur wenig eingeschränkt sein.

Die verwendeten Fragen stammen aus dem sogenannten "International Personality Item Pool". Damit basiert der Fragebogen auf dem wissenschaftlich etablierten Big-Five-Modell der Persönlichkeit. Durch die explizite Zustimmung der Nutzer war eine personenbezogene Verknüpfung mit den individuellen Facebook-Profilen möglich.

Entzauberung der Algorithmen

Kosinski konzentriert sich auf die "Likes": Er versucht, individuelle Variationen in den Persönlichkeitseigenschaften gemäß der Selbsteinschätzung in den Fragebögen mithilfe von Likes vorherzusagen. Dieser Schritt wird in den Medien oft mit dem nebulösen Begriff "Algorithmus" umschrieben. Tatsächlich handelt es sich jedoch um statistische Zusammenhangsmaße in Form von Korrelationskoeffizienten und linearen Mehrfachregressionen mit vergleichsweise kleinen Verfeinerungen. Kosinskis Datengrundlage für diese Auswertung beruht grob geschätzt auf etwa 70 Millionen Datenpunkten.

Trotz dieser scheinbar großen Datenmenge und entgegen der Darstellung in den Medien spricht Kosinski nicht von "Big Data". Das ist kaum verwunderlich, denn der Datenumfang seiner Untersuchung erfordert keine spezifische Software, die über die Funktionen handelsüblicher Statistikprogramme hinausgehen würde – eine Voraussetzung, die zum Teil als Definitionsmerkmal von Big Data gilt.

Zusammenhänge hinterfragen

Kosinski gibt seine Kernergebnisse meist als Korrelationskoeffizienten an. Der Korrelationskoeffizient beschreibt den statistischen Zusammenhang zwischen zwei Merkmalen im Bereich von minus eins (vollständiger negativer Zusammenhang) bis plus eins (vollständiger positiver Zusammenhang).

In einer Studie von 2012 untersuchten Kosinski und seine Kollegen Yoram Bachrach, Thore Graepel, Pushmeet Kohli und David Stillwell zunächst Korrelationen bei abstrakten Metadaten — zum Beispiel, wie die Anzahl der Likes oder Gruppenzugehörigkeiten mit der Persönlichkeit zusammenhängt. Dabei stellten die Forscher nur sehr geringe Korrelationen mit Persönlichkeitseigenschaften fest, wobei diese spezielle Auswertung aufgrund der geringeren Verfügbarkeit von Metadaten ohnehin kaum repräsentativ ist.

Gerade bei den personalwirtschaftlich zentralen Persönlichkeitseigenschaften Gewissenhaftigkeit und Verträglichkeit sind die Zusammenhänge besonders gering — diese Persönlichkeitseigenschaften sind etwa im Zusammenhang mit dem Berufserfolg und der Zusammensetzung von Teams relevant. Abstrakte Metadaten, wie sie Kosinski untersucht hat, eignen sich somit kaum zur validen Prognose von Persönlichkeitseigenschaften.

Social-Media-Interesse und Persönlichkeit

Vielversprechender ist die inhaltliche Auswertung der Likes, also die Frage, welche und nicht wie viele Themen jemand unterstützt. Dieser Frage ging Kosinski zusammen mit seinen Kollegen Wu Youyou und David Stillwell in einer Studie von 2015 nach.

Das Ergebnis: Bei Berücksichtigung aller Likes beträgt die durchschnittliche korrigierte Korrelation 0,56 – ein Wert, der auch vor dem Hintergrund von Vergleichsstudien als hoch zu bewerten ist. Hierbei weisen einzelne Themenseiten besonders hohe Korrelationen auf – zum Beispiel "Mitt Romney" für Gewissenhaftigkeit und "Hello Kitty" für Neurotizismus, also für die emotionale Labilität des Charakters.

Der Computer als Menschenkenner

Ein alternativer Vergleich zu den Metastudien, die Kosinski zur Einordnung seiner Messwerte heranzieht, wäre die Vorhersagekraft von Personalauswahlverfahren für den späteren Berufserfolg. Hier ergeben sich ähnlich hohe Korrelationswerte von über 0,5 für Intelligenztests und strukturierte Interviews. Wissenschaftlich untersucht ist übrigens auch, wie verlässlich Personalmanager subjektiv Persönlichkeitseigenschaften auf Basis der Sichtung eines Facebookprofils einschätzen können: Die Prognosegüte in diesem Zusammenhang liegt nahe null.

Daher sollten Personaler wohl eher den sogenannten Algorithmen als ihrer Intuition vertrauen. Damit wird es tatsächlich möglich, durch inhaltliche Analyse des Facebook-Verhaltens gute Rückschlüsse auf das Persönlichkeitsprofil zu ziehen. 

Social Media: Darstellung des Selbst oder doch Selbstdarstellung?

Wie andere Forscher vor ihm, verwendet auch Kosinski Persönlichkeitsfragebögen, mit denen die Social-Media-Nutzer ihre Persönlichkeit selbst einschätzen. Das Problem dabei ist, dass auf den Social-Media-Plattformen oft "Impression Management", also Selbstoptimierung, betrieben wird. Deshalb ist es naheliegend, dass etwa eine Person, die gerne als eher extrovertiert wahrgenommen werden möchte, sich nicht nur etwas extrovertierter einschätzt, sondern auch mehr Kontakte sammelt.

Bei Kosinskis Korrelationsanalysen ist entsprechend anzunehmen, dass die Datengrundlage durch Faktoren wie soziale Erwünschtheit, Impression Management und Kohärenzerwartungen zumindest leicht verzerrt wurde. Das gilt übrigens auch für zahlreiche andere Studien zum Zusammenhang zwischen der Social-Media-Nutzung und den Persönlichkeitseigenschaften.

Cognitive HR: Künstliche Intelligenz im Recruiting?

In der Summe können die schwachen Zusammenhänge zwischen verschiedenen Social-Media-Attributen und Persönlichkeitsmerkmalen trotzdem genutzt werden, um Tendenzen der Nutzerpersönlichkeit zu erkennen. Hier kommen zunehmend prädiktive maschinelle Lernverfahren zum Einsatz, die auch sehr komplexe Zusammenhänge abbilden können.

Das Schlagwort für diese Verfahren lautet künstliche Intelligenz: Beispielsweise konnten Forscher zeigen, dass maschinell trainierte sogenannte Entscheidungsbäume deutlich bessere Ergebnisse liefern als lineare Regressionsmodelle. Derzeit wird daran gearbeitet, durch sogenannte "Deep-learning-Ansätze" weitere Verbesserungen zu erreichen. Die wesentlichen Vorteile solcher Verfahren sind die geringen Einsatzkosten und die Geschwindigkeit: Zumindest grobe Persönlichkeitstendenzen lassen sich somit kostengünstig und beinahe in Echtzeit ermitteln, was beispielsweise für E-Recruiting Systeme hochinteressant ist.

Facebook & Co. als Big Data Dealer

Trotz der Offenheit des Internets ist absehbar, dass die Betreiber von Social-Media-Plattformen die benötigten Daten nicht kostenlos zur Verfügung stellen werden. In Sachen Anfragefrequenz, Anfragezeitraum und Nutzerbreite wird es bei den kostenlosen Datenschnittstellen aller großen Betreiber Einschränkungen geben.

Zudem müssen die Nutzer häufig der Auswertung applikationsspezifisch zustimmen, bevor überhaupt Daten abrufbar sind.

Stephen Colbert ist eben nicht Harald Schmidt

Hinzu kommt, dass sich einige prädiktive Social-Media-Attribute ständig ändern: Als "Persönlicheitsindikator" weist beispielsweise das Interesse an der Late-Night-Show "Colbert-Report"  eine hohe Prognosegenauigkeit auf; die Show ist inzwischen aber eingestellt. Ebenso dürfte die Bedeutung von "Mitt Romney" in den sozialen Netzwerken wohl künftig abnehmen. Zudem sind die Ergebnisse in vielen Fällen länderspezifisch.

Eine Übertragung auf Deutschland ist damit oft nur mit Analogieschlüssen alla "Colbert ist gleich Harald Schmidt" möglich, womit der Zusammenhang jedoch fraglich wird. Daher müssten in Deutschland zunächst eigene Studien durchgeführt werden.

Big Data als Orientierungshilfe

Analysen des Social-Media-Verhaltens lassen nur grobe Rückschlüsse auf die Persönlichkeit zu. Sie eignen sich damit zwar nicht für individuelle Aussagen, ermöglichen aber eine überblicksartige Segmentierung anhand von fünf Persönlichkeitseigenschaften. Da Big-Data-Analysen stets Wahrscheinlichkeitseinschätzungen sind, ist eine exakte Vorhersage nicht möglich und wird auch nie möglich sein.

Trotzdem sollten sich Personal­manager jedenfalls die Grundlagen aneignen: Sie sollten Wahrscheinlichkeiten als solche anerkennen und sich mit deren Logik beschäftigen – dazu ist Übung erforderlich. Notwendig bleibt das jedoch allemal, denn aus wissenschaftlicher Sicht stehen die Chancen für den Algorithmus schon heute gut: Seine Prognosen sind verlässlicher als die des Personalers, der einen Kandidaten anhand seines Facebook-Profils einschätzt. 


Prof. Dr. Heiko Weckmüller lehrt Human Resource Management an der FOM Hochschule Bonn.

Prof. Dr. Ricardo Büttner lehrt Wirtschaftsinformatik, Organisation und Personal an der FOM Hochschule München.

Heiko Weckmüller und Ricardo Büttner

Schlagworte zum Thema:  Big Data, Digitalisierung, Personalauswahl, Recruiting