Performance Management: Fallstricke bei der Leistungsbewertung

Zielvereinbarungen und leistungsorientierte Vergütung sind ein Grundpfeiler des Personalmanagements und werden in vielen Firmen zur Anreizgestaltung der Mitarbeiter verwendet. Die  Auswirkung auf die Arbeitsleistung und Arbeitszufriedenheit ist jedoch nicht ohne weiteres zu bestimmen.

Verhaltensökonomische Untersuchungen zu den Vor- und Nachteilen von Mitarbeiterbewertungsmechanismen zeigen, dass Favorisierung und Fairnessbedenken des Vorgesetzten die Bewertung von Mitarbeitern verzerren. Doch auch durch stärkere Differenzierung können Nachteile entstehen, wenn der Unternehmenserfolg stark von der Zusammenarbeit im Team abhängt. Das ist das Fazit einer aktuellen Studie des Instituts für deutsche Wirtschaft (IW) Köln.

Leistungsbewertung – wozu?

Viele psychologische Studien untersuchen zwar Performance-abhängige Evaluationsmaßnahmen, es mangelt jedoch an Untersuchungen über die Folgen derartiger Anreizsysteme: Welche Konsequenzen haben sie beispielsweise für das Realgeschehen in Unternehmen, für die Produktivität des Einzelnen und die Kooperation bei Teamarbeit?

Die vorliegende Studie des IW Köln zeigt, dass Unternehmen Mitarbeiterbewertungen für mehrere Zwecke nutzen:

  • Erstens um die Höhe von Bonuszahlungen zu bestimmen.
  • Zweitens ist die Bewertung eine Rückmeldung für den Mitarbeiter über seine Stärken und Schwächen.
  • Drittens können dann Entwicklungsperspektiven aufgezeigt und dazu entsprechende Weiterbildungsmaßnahmen abgeleitet werden.
  • Viertens werden die Ergebnisse von Mitarbeiterbewertungen für Entscheidungen über Beförderung, Umstrukturierung oder Entlassungen herangezogen.

Zielvereinbarungen: Objektive Kriterien häufig nicht verfügbar

Tatsache ist - so der Studienbericht des IW Köln -, dass Zielvereinbarungen nicht ausschließlich auf objektiven Kriterien beruhen, sondern sich teils bis sogar ausschließlich aus der subjektiven Einschätzung des Vorgesetzten ergeben. Der simple Grund dafür ist, dass objektive Kriterien nicht verfügbar sind. Es fehlen Kennzahlen, mit denen die Bewertung vorgenommen werden kann. Sogar bei rein objektiven Bewertungen, wie im Bereich von Vertrieb und Verkauf durch Verkaufszahlen, besteht Konfliktpotenzial. Denn Vorgesetzte müssen zwischen Mitarbeitern differenzieren und brauchen dafür einen Vergleichsmaßstab.

Subjektive Leistungsbewertung: Soziale Nähe führt zu wohlwollender Beurteilung

Gibt das Management den Vorgesetzten nur eine Skala vor, bewerten Vorgesetzte ihre Mitarbeiter oft wohlwollend und nutzen nicht die komplette Bewertungsskala nach unten aus, so die IW-Studie. Die Gründe hierfür seien in den sozialen Präferenzen wie Altruismus, Favorisierung und Ungleichheitsaversion (Bevorzugung gleicher Auszahlungen) zu finden, heißt es im Studienbericht. Der Verhaltensökonom Anders Frederiksen hat die subjektiven Mitarbeiterbewertungen aus sechs Studien zusammengefasst und damit gezeigt, dass Manager bei der Bewertung auf einer fünfstufigen Skala mehr als 95 Prozent der Mitarbeiter nur drei Stufen zuordnen. Vor allem die beiden schlechtesten Kategorien werden nur sehr selten genutzt. Ein Grund für wohlwollende Bewertungen ist demnach die soziale Nähe zwischen Vorgesetztem und Mitarbeiter.

Bei einer Untersuchung der Mitarbeiterbewertungen eines Call Centers fanden Professor Dirk Sliwka und seine Kollegen heraus, dass Mitarbeiter für die gleiche Leistung eine bessere Beurteilung erhielten, wenn sie längere Zeit mit demselben Vorgesetzten oder in einem kleinen Team arbeiteten. Die Wahrscheinlichkeit für eine gute Mitarbeiterbewertung war höher, wenn sie von demselben Vorgesetzten durchgeführt wurde wie zuvor. Die Bewertungen von Managern, die einen Mitarbeiter zum ersten Mal bewerteten, fielen im Durchschnitt hingegen schlechter aus. Um dies zu verhindern, kann das Management ein Ranking für die Bewertungen empfehlen oder vorgeben.

Steigende Leistung durch "Forced Ranking"

Eine wohlwollende Bewertung kann laut der Studie des IW Köln allerdings den Anreiz für Mitarbeiter reduzieren, die eigene Produktivität zu steigern, um eine höhere Bonuszahlung zu erhalten. Einige Unternehmen verwenden daher ein „Forced Ranking“, also ein vorgegebenes Schema gemäß dem sich die Bewertungen auf die gesamte Skala verteilen müssen. Hier nehmen die Wissenschaftlerinnen des IW Köln wieder auf Experimente am Lehrstuhl von Professor Dirk Sliwka Bezug:  Darin wurde der Effekt der Bewertungen auf die Arbeitsproduktivität von Teams untersucht. Das Ergbnis: Ohne Bewertungsvorgaben ordneten die Teamleiter die Mitarbeiter in 82 Prozent der Fälle in die oberen beiden der fünf Kategorien ein. Bei Verwendung eines „Forced Ranking“ mussten sie jeweils einen der drei Mitarbeiter in Kategorie 1 oder 2, einen in Kategorie 3 und einen in Kategorie 4 oder 5 zuordnen. Dabei verhielten sich die Teamleiter noch so wohlwollend wie möglich und ordneten die Mitarbeiter eher Kategorie 1 als 2 und eher 4 als 5 zu (siehe Abbildung).


Forced Ranking

Die Teamleistung stieg bei beiden Bewertungsmechanismen im Verlauf der acht gespielten Runden. Bei differenzierter Bewertung durch das „Forced Ranking“ lag die Teamleistung aber durchweg auf einem höheren Niveau. Der Grund dafür ist, dass die Auszahlung der Mitarbeiter von den Bewertungen abhängig war und der Anreiz, die Leistung zu steigern bei dem „Forced Ranking“ stärker ist. (Lesen Sie hier auch ein Interview mit Dirk Sliwka zum selben Thema: "Leistungsbeurteilungen erhöhen die Arbeitszufriedenheit").


Negative Auswirkungen von Forced Ranking

Ein Forced Ranking kann aber auch die Konkurrenz unter den Mitarbeitern erhöhen, was insbesondere in einem Arbeitsumfeld schadet, in dem Teamarbeit wesentlich zur Produktivität beiträgt. In einer Abwandlung des Experiments von Professor Dirk Sliwka konnten die Teilnehmer die Leistung anderer Teammitglieder durch Blockieren des Computerbildschirms sabotieren, was auch eine kurze Blockade ihres eigenen Bildschirms verursachte. Diese Möglichkeit nutzten Teilnehmer, die mit einem „Forced Ranking“ bewertet wurden, doppelt so häufig wie ohne Vorgaben bewertete Teilnehmer. Die Sabotage beeinflusste die Teamleistung unter beiden Bewertungsmechanismen negativ. Die Leistung in den Teams mit „Forced Ranking“ war mit der Möglichkeit zur Sabotage anderer Teilnehmer allerdings geringer als in den Vergleichsgruppen ohne Vorgabe (siehe Abbildung). Eine größere Differenzierung in den Bewertungen erhöht also die Einzelproduktivität der Mitarbeiter, steigert aber die Konkurrenz zwischen den Mitarbeitern. Wenn Teamleistung erforderlich und Zusammenarbeit notwendig ist, kann sich dies negativ auf den Unternehmenserfolg auswirken (z.B. durch Sabotage oder Behinderung der Kollegen).

Mehr Gerechtigkeit durch bessere Leistungsanreize

Die Studienautorinnen des IW Köln fassen ihre Erkenntnisse wie folgt zusammen: Nach oben verzerrte Mitarbeiterbewertungen verursachen direkte Kosten durch höhere Bonuszahlungen und indirekte Kosten durch geringere Leistungsanreize. Bei der Gestaltung eines Bewertungssystems können Favorisierungen, Fairnessbedenken und Sorge um das Wohlbefinden der Mitarbeiter von Vorgesetzten die Bewertungen beeinflussen. In der Folge stellt diese Art der Mitarbeiterbewertung kein effektives Anreizsystem dar. Ein ‚Forced Ranking‘ für Bewertungen nutzt als Lösung nur, wenn die Zusammenarbeit in Teams nicht essentiell für den Unternehmenserfolg ist. Dies ist meist reine Theorie. Die Praxis sieht anders aus. Besteht die Möglichkeit, Kollegen zu sabotieren, kann eine erzwungene Differenzierung in den Mitarbeiterbewertungen mehr schaden als nutzen. Eine Loslösung von kalibrierten Beurteilungen fällt aber schwer, wenn die besten Mitarbeiter identifiziert, gefördert und belohnt werden sollen.

Alternative: "Spot Awards"

Als Alternative schlagen die Wissenschaftlerinnen vom IW Köln so genannte "Spot Awards" vor. Mit Spot Awards werden herausragende Leistungen für kleinere Projekte gewürdigt und belohnt. Dabei steht die Belohnung unmittelbar nach Projektabschluss an und ist unabhängig von der Vergütungen die ein Mitarbeiter erwartet.


Mehr zum Thema Performance Management:

Systeme zur Leistungsbewertung müssen verbessert werden


IW Köln