Prof. Dr. Christoph Eisl, Prof. Dr. Heimo Losbichler
Angesichts der rasant steigenden Datenmengen erlauben die vorgestellten traditionellen Diagramme und (grafischen) Tabellen immer weniger, Zusammenhänge und Entwicklungen rasch zu erkennen. Es werden daher kontinuierlich neue Visualisierungstypen und Interaktionstechniken entwickelt, welche helfen sollen, Big Data nutzbar zu machen und adäquate Maßnahmen daraus abzuleiten.
Benutzerzentrierte interaktive Visualisierungen ermöglichen es den Nutzern, direkt mit der Visualisierung zu interagieren. Der Anwender kann einfacher Muster und Ausreißer erkennen, gleichzeitig wird seine kognitive Belastung reduziert.
Die nachfolgenden Beispiele konzentrieren sich auf neue Big-Data-Visualisierung zur Darstellung von multidimensionalen bzw. hierarchischen Datenbeständen. Ein multi- oder mehrdimensionaler Datenbestand setzt sich hierbei aus mehreren informationstragenden Attributen oder Fakten (z. B. Umsatz, Deckungsbeitrag) und beschreibenden Dimensionen (z. B. Händler, Land) zusammen.
Tipp: Passen Sie verfügbare Standardvorlagen an Ihre Bedürfnisse an und integrieren Sie mehrere Interaktionstechniken.
Für viele neuartige Big-Data-Visualisierungen stehen in MS Excel oder eigenen Web-Bibliotheken (z. B. D3.js) Standardvorlagen zur Verfügung. Auf Grundlage einer empirischen Studie lässt sich jedoch feststellen, dass diese noch ein erhebliches Optimierungspotenzial in Bezug auf ihre Ausgestaltung sowie die Erweiterung des Interaktionskonzepts aufweisen. Die im Folgenden präsentierten Beispiele enthalten bereits Funktionalitäten, die über die frei verfügbaren Standards teils deutlich hinausgehen. Spezifische Anpassungen der webbasierten Vorlagen erfordern zwar einen gewissen Programmieraufwand, führen aber auch zu wesentlichen Effektivitäts- und Effizienzfortschritten.
Auch wenn die genutzten Interaktionstechniken in diesem Leitfaden beschrieben werden, sind sie doch wesentlich besser verständlich, wenn man sie selbst ausprobieren kann. Einige der im Folgenden beschriebenen interaktiven Visualisierungen stehen auf folgender Homepage zum Testen zur Verfügung: http://www.usivis.org.
5.1 Treemap-Visualisierungen
Eine Treemap dient der Präsentation von hierarchischen Strukturen durch den Einsatz von verschachtelten Rechtecken. Dabei lässt sich von der Größe des jeweiligen Rechteckes auf den jeweiligen Anteil an der Gesamtmenge schließen. Charakteristisch für diese Darstellung ist es daher, mittels Größenverhältnissen einen relativen Bezug zwischen den dargestellten Informationen untereinander herzustellen. So soll das rasche Erkennen von relativen Verhältnissen, Größenordnungen und Verbindungen erleichtert werden.
Zusätzlich kann durch den Einsatz von Farben eine Gruppierung logisch zusammengehöriger Rechtecke vorgenommen werden. Durch die Erweiterung um Drilldown-Möglichkeiten (z. B. Klick auf eine Gruppierung oder auf ein einzelnes Rechteck), können ergänzende Detailinformationen dargestellt werden.
Im folgenden Beispiel wird die Marktkapitalisierung der DAX30 Unternehmen in einer Treemap dargestellt. Dabei lässt sich auf Basis der Farbe eine Zuordnung zu einer Branche ablesen. Die Größe der Rechtecke gibt Aufschluss über den Anteil an der Marktkapitalisierung der jeweiligen Branche bzw. des einzelnen Unternehmens.
Abb. 58: Beispiel Treemap mit färbiger Gruppierung
5.2 Sankey-Diagramme
Sankey-Diagramme stellen eine effektvolle Alternative zu klassischen Diagrammtypen dar und werden insbesondere zur Darstellung von Material- und Mengenflüssen verwendet. In den vergangenen Jahren wurde diese Darstellungsform bevorzugt in der Wirtschaft zur Beschreibung von Wertschöpfungsketten, aber auch in der Politik zur visuellen Repräsentation von Wählerstromanalysen eingesetzt. Das Sankey-Diagramm zeigt relativ rasch und intuitiv Größenverhältnisse und Relationen einzelner Ströme zur Gesamtmenge. Die Visualisierung besteht aus Verbindungen, auch Flüsse genannt, welche einen Knoten (Dimension 1) mit einem Weiteren (Dimension 2) verbinden. Dabei visualisiert die Breite des Stroms den Anteil der Gesamtmenge und bietet zusätzlich die Möglichkeit der Darstellung von Unterkategorien.
Voraussetzungen für einen optimalen Einsatz sind die Vermeidung von negativen Werten im Datenbestand und die Sicherstellung, dass die Summe der Datenströme immer 100 % ergibt.
Im folgenden Beispiel wird ein multidimensionaler Datenbestand aus der Branche Weinhandel mit einem Sankey-Diagramm dargestellt. Auf der höchstaggregierten Ebene (linke Achse) wird das Attribut Absatzmenge als Gesamtmenge abgebildet. Auf den weiteren Achsen werden die Absatzmengen nach verschiedenen Dimensionen wie Weinhändler, Rebsorte sowie Herkunftskontinent und -staat der jeweiligen Weinsorte geclustert. Die Mengenströme werden als Verbindungen zwischen den einzelnen Clustern visualisiert. Als unterstützende Interaktionen sind Verschiebungen der Dimensionen (Interaktionstechnik "Arrange") in Kombination mit der Hervorhebung von Verbindungsströmen (Interaktion...