five black rolling chars front of desk
Foto von Brusk Dede

Auch im Personalmanagement wachsen die Datenbestände durch operationale HR-Systeme, HR-Data-Warehouse-Systeme und zunehmend durch Daten im Web, ständig. Die zunächst naheliegende Vermutung ist, dass auch HR gewachsene Datenbestände sinnvoll verwenden kann. Ein professioneller Einsatz von Big Data verspricht dem Personalmanagement beispielsweise „erhebliche Wettbewerbsvorteile“ – entsprechend gross ist die Hoffnung. Allerdings lehren Erfahrungen mit IT-Innovationen, im Personalmanagement eher vorsichtig zu sein – zu häufig folgte auf eine Phase überzogener Erwartungen eine Phase der Desillusionierung. Dieser Beitrag zielt daher mit der Existenz und mit der Nützlichkeit von Big Data im Personalmanagement auf die Beantwortung zweier grundsätzlicher Fragen: Existieren im Personalmanagement tatsächlich Big Data und können sie tatsächlich nützlich sein?

                   Personalwirtschaftliche Daten haben
                               keine per se zwingende
                       personalwirtschaftliche Relevanz …

 

Literaturtipps

>> HR Intelligence und Analytics – Datenschutzrechtliche Grenzziehungen.
Von Peter Gola, In: Stefan Strohmeier und Franca Piazza (Hrsg.):
Human Resource Intelligence und Analytics. Springer Fachmedien Wiesbaden 2015, S. 127-158.

>> Analysen der Human Resource Intelligence und Analytics. Von Stefan Strohmeier.
In: Stefan Strohmeier und Franca Piazza (Hrsg.): Human Resource Intelligence und Analytics.
Springer Fachmedien Wiesbaden 2015, S. 3-47.

>> Trends der Human Resource Intelligence und Analytics.
Von Stefan Strohmeier, Franca Piazza und Christian Neu.
In: Stefan Strohmeier und Franca Piazza (Hrsg.): Human Resource Intelligence und Analytics.
Springer Fachmedien Wiesbaden 2015, S. 339-367.

—————–

Quelle: personal manager – Zeitschrift für Human Resources
Ausgabe 4 / 2015 

Fotos:

(1) I.Rasche | pixelio.de
(2) Eva Hamperl |
pixelio.de

 

Existenz von Big Data


Mit Blick auf die grundsätzliche Existenz von Big Data gilt zunächst auch für das Personal-management, dass Datenbestände in der Vergangenheit ständig zugenommen haben und auch in Zukunft vermutlich weiter wachsen. Gleichwohl ist eine systematische Prüfung ratsam, ob diese Datenbestände tatsächlich Big Data entsprechen. Dazu ist es notwendig, den Begriff Big Data zu klären. Nach dem sogenannten „3 V-Modell“ müssen die drei Kriterien des Volumens, der Varietät und der Geschwindigkeit von Daten (im Englischen „volume“, „variety“ und „velocity“) gemeinsam erfüllt sein, um von Big Data sprechen zu können.

Das grosse Datenvolumen ist damit ein erstes Kriterium, das namensgebend für Big Data ist. Die Operationalisierung eines grossen Datenvolumens erfolgt dabei zum einen über die Angabe einer gewissen Byte-Grenze. Jedoch existiert kein genereller Konsens bezüglich dieser Grenze. Als grober Anhaltspunkt sollten Daten im Terabyte-Bereich liegen, damit ein Datenvolumen „gross“ ist. Zum an-deren definieren neue Datenhaltungs- und Datenanalysewerkzeuge („Inmemory Appliances“) die Operationalisierung eines grossen Datenvolumens. Big Data kommt somit zum Einsatz, wenn konventionelle Datenhaltungs- und Analysewerkzeuge an ihre Grenzen stossen.

Auch im Personalmanagement hat sich das Datenvolumen permanent vergrössert. Dies begründet sich erstens in einer fortgesetzten „Informatisierung“ des Personalmanagements, die zu einer Reihe unterschiedlicher HR-Systeme und damit entsprechend zu einem breiten Bestand an Personaldaten über verschiedene personalwirtschaftliche Funktionen hinweg geführt hat. Neben diesen konventionellen Datenquellen existieren zunehmend neue interne und externe Datenquellen. Beispielhaft für neue interne Datenquellen stehen dabei Prozesslogdaten (Daten zur systemgestützten Durchführung von HR-Prozessen) oder Weblogdaten (Daten zum Verhalten von Nutzern auf HR-Webseiten oder von webbasierten HR-Systemen). Beispiele für neue externe Datenquellen bilden etwa „Open Data“ (zur Verfügung gestellte Daten öffentlicher Institutionen, z.B. Arbeitsmarktdaten der Arbeitsagenturen) oder „User Generated Content“ (von Webnutzern erstellte Inhalte, wie z.B. Arbeitgeberbewertungen von Arbeitgeberbewertungsportalen). Trotz dieses Datenwachstums dürften tatsächlich verwendbare beziehungsweise verwendete Datenbestände derzeit verbreitet im Gigabyte-Bereich liegen. Datenvolumina im grösseren Terabyte-Bereich dürften dagegen wenigen sehr grossen Unternehmen vorbehalten sein. Eine grundlegende Änderung dieser Situation ist allerdings dann absehbar, wenn Unternehmen Sensordaten aus dem Internet der Dinge („Industrie 4.0“) für personalwirtschaftliche Zwecke verwenden sollten.

Ein weiteres Kriterium besteht in der Varietät von personalwirtschaftlichen Daten. Diese lassen sich grundsätzlich in strukturierte Daten und unstrukturierte Daten kategorisieren. Strukturierte Daten haben die Eigenschaft, in einer einheitlichen vordefinierten Datenstruktur, wie beispielsweise in Datenfeldern und -tabellen, organisiert zu sein. Unstrukturierte Daten, wie zum Beispiel Textdateien, besitzen keine einheitliche vordefinierte Struktur. Kombinationen aus beidem tragen die Bezeichnung „semistrukturierte Daten“. Im Personalmanagement gibt es neben strukturierten zunehmend semi- und unstrukturierte Daten sowie korrespondierende Möglichkeiten, solche Daten mittels Text Analytics zu analysieren. Intern treten diese durch Dokumente aus elektronischen Personalakten oder Freitextfeldern von HR-Systemen auf. Extern kommen diese insbesondere durch Webinhalte aus sozialen Netzwerken und Arbeitgeberbewertungsportalen vor. Damit stehen zunehmend unstrukturierte Daten zur Verfügung, die die Varietät und daneben natürlich auch das Volumen personalwirtschaftlicher Daten spürbar erhöhen.

Ein drittes definierendes Kriterium besteht in der Geschwindigkeit entstehender Daten und deren Analyse. Grundsätzlich gilt diesbezüglich, dass die Kombination von Datenentstehung und -analyse in Echtzeit eine deutliche Ausnahme darstellt – so beispielsweise die Echtzeitüberwachung des Zutritts zu Gefährdungszonen auf der Basis von Zutrittsdaten. Generell überwiegt vielmehr eine „historische“ Datenverarbeitung, bei der zwischen einem Ereignis und dessen Speicherung, sowie zwischen der Speicherung und der Analyse oft längere Zeiträume liegen. Damit ist die Geschwindigkeit derzeit gering; erneut dürfte sich dies mit einer personalwirtschaftlichen Nutzung des Internets der Dinge grundlegend ändern, denn hier fallen kontinuierliche Sensordaten in Echtzeit an.

Zusammengefasst lässt sich damit ein Anstieg von Datenvolumen, -varietät und -geschwindigkeit ohne Frage auch für das Personalmanagement feststellen. Verglichen mit anderen Anwendungsbereichen ist dieser Anstieg allerdings in den meisten Fällen moderater Natur; insbesondere aufgrund beschränkter Volumina und Geschwindigkeiten ist derzeit (noch) nicht von einer flächendeckenden Existenz von Big Data im Personalmanagement auszugehen (Abbildung 1).

Die wichtigste Veränderung besteht in der gewachsenen Datenvarietät. Zusätzlich zu den konventionell für Analysezwecke verwendeten transaktionalen personalwirtschaftlichen Daten können Unternehmen inzwischen über weitere strukturierte (z.B. Prozess-und Weblogdaten) und insbesondere unstrukturierte (z.B. Textdateien) Daten verfügen und diese analysieren.

Nützlichkeit von Big Data

Big Data eilt implizit sehr häufig der Ruf voraus, für die Personalwirtschaft nützlich zu sein, weshalb eine explizite Untersuchung oft ausbleibt. Unternehmen sollten Daten allerdings nur dann verwenden, wenn sie tatsächlich zu Informationen führen, die Entscheidungen des Personalmanagements unterstützen und verbessern. Derzeit liegen keine wissenschaftlichen Erkenntnisse zur Nützlichkeit vor, einige Anmerkungen lassen die gewonnenen Erfahrungen aber dennoch zu.

Ein erster wichtiger Punkt besteht darin, dass Volumen, Variantenreichtum und hohe Entstehungsgeschwindigkeit personalwirtschaftlicher Daten keineswegs zwingend auch personalwirtschaftliche Relevanz von Daten bedeutet. Erfahrungen mit Data Mining – einer Gruppe von Analysemethoden – von transaktionalen Daten zeigt beispielsweise, dass es schwierig ist, interessante neue Fakten zu entdecken und vorherzusagen. Stattdessen „reproduzieren“ Algorithmen oft nur vordefinierte Personalprozesse und -politiken. Beispielsweise beruht die Personalauswahl in vielen Unternehmen auf vorgegebenen Einstellungspolitiken, die für bestimmte Positionskategorien bestimmte Bewerberkategorien bevorzugen. Die Analyse von historischen Beschaffungs- und Auswahldaten im Hinblick auf Informationen zu geeigneten Kandidaten spiegelt im Ergebnis lediglich diese Auswahlpolitik wider – sinnvolle Muster zu geeigneten und ungeeigneten Bewerbern ergeben sich nicht. In diesem Fall sind selbst sehr grosse Datenbestände nicht wirklich relevant. Als zentrale Konsequenz gilt es festzuhalten, dass das Personalmanagement eher auf die Relevanz von Daten zu achten hat, denn auf Volumen, Varietät und Geschwindigkeit.

Ein zweiter wichtiger Punkt liegt im Mangel an Anwendungsfällen („use cases“) zu Big Data im Personalmanagement. Die blosse Verfügbarkeit von umfangreichen Datenbeständen und ausgereiften Analysetools stellt nämlich keineswegs bereits wertvolle Informationen bereit. Anwendungsfälle bestehen aus konkret ausgearbeiteten Vorschlägen zur Nutzung von Big Data, die die praktische Frage- beziehungsweise Problemstellung, benötigte Daten und Analysemethoden sowie Vorgehensweisen umfassen.

Ein Beispiel eines bereits ausgearbeiteten Anwendungsfalls ist die personalwirtschaftliche Sentimentanalyse. Eine Sentimentanalyse zielt auf die automatische Extraktion von Einstellungen beziehungsweise Meinungen aus textbasierten Dokumenten. Vor personalwirtschaftlichem Hintergrund können Unternehmen Bewertungstexte von Arbeitgeberbewertungsplattformen, die etwa Vergütung, Entwicklung, Betriebsklima und Work- Life-Balance bewerten, sammeln und automatisch analysieren. Die Extraktion solcher Einstellungen kann dem Personalmanagement wichtige Hinweise zu eigenen Stärken und Schwächen und deren Einschätzung durch zentrale Stakeholder geben. Die konkrete Ausarbeitung erfolgreicher Anwendungsfälle bleibt hingegen eine offene und absehbar aufwendige sowie komplexe Aufgabe für die künftige Forschung und Praxis im Bereich Big HR-Data. Ohne solche ausgearbeiteten Anwendungsfälle bleiben Big- Data-Analysen im Personalmanagement komplex, arbeitsreich und eher zufällig erfolgreich.

Ein dritter und letzter Punkt motiviert sich aus der Tatsache, dass Personaler üblicherweise keine ausgebildeten Datenanalysten sind, die mit einer grossen Bandbreite unterschiedlicher komplexer Analysemethoden und -software unproblematisch umgehen können. Darüber hinaus fehlt es oft an umfangreicheren Zeitbudgets, um voluminöse, heterogene Datenmengen zu analysieren. Aus diesem Grund ist die Implementation von ausgearbeiteten Anwendungsfällen in end-anwenderfreundlicher personalwirtschaftlicher Anwendungssoftware und damit das „Verstecken“ methodischer und technischer Komplexität von Big-Data-Analysen ein wichtiger Punkt für eine künftig erfolgreiche und verbreitete Nutzung von Big Data im Personalmanagement.

Fazit

Zusammengefasst können und dürfen Unternehmen im Personalmanagement keineswegs ohne Weiteres von der Existenz und Nützlichkeit von Big Data ausgehen. Das blosse Bereitstellen von (Big) Data und mächtigen Analysetools garantiert noch keinen Erfolg. Vielmehr braucht eine erfolgreiche und verbreitete Adoption von Big-Data-Analysen in der Zukunft die Evaluation und Sicherstellung der Relevanz der jeweiligen Daten, die Ausarbeitung und den Test erfolgreicher Anwendungsfälle sowie deren Implementation in endanwenderfreundlicher personalwirtschaftlicher Anwendungssoftware.