Die Kunst Maschinendaten verständlich darzustellen – Ein Fallbeispiel

Wir haben Daten, aber keiner versteht sie.. Lerne durch dieses Fallbeispiel wie es geht!

Datenvisualisierung ist die grafische Darstellung von Informationen und Daten. Durch die Verwendung visueller Elemente wie Diagramme, Grafiken und Karten bieten Datenvisualisierungstools eine zugängliche Möglichkeit, Trends, Ausreißer und Muster in Daten zu erkennen und zu verstehen. In der Welt von Big Data sind Datenvisualisierungstools und -technologien unverzichtbar, um riesige Mengen an Informationen zu analysieren und datengestützte Entscheidungen zu treffen.

Ein Fallbeispiel zur Datenvisualisierung

Viele Menschen lernen besser mit praktischen Beispielen. In diesem Artikel möchte ich Euch auf eine Rundreise von Maschinendaten zu einem verständlichen Diagramm mitnehmen. Ziel dabei ist es den Zustand einer Verkaufsstelle in Bezug auf Anzahl verarbeiteter Verkaufstransaktionen interpretieren zu können.

1. Maschinendaten

Um geschäftskritische Prozesse auswerten zu können benötigt man die entsprechenden Maschinendaten in einer Datenplattform. Diese Datengrundlage kann aus Protokolldateien, Datenbanken, oder sonstigen Quellen erhoben werden.

In diesem Beispiel wurde ein spezifischer Protokolleintrag identifiziert. Dieser Eintrag teilt uns mit, dass eine Verkaufstransaktion vom System verarbeitet wurde. Um mit dem nächsten Schritt fortzufahren müssen alle diese Protokolldateien in Echtzeit in die Datenplattform eingelesen werden.

2. Daten kennenlernen

In diesem Schritt möchten wir alle gesammelten Protokolldateien durchgehen und den relevanten Eintrag aus Schritt 1 über einen gewissen Zeitraum (Verkaufstag) summiert darstellen. Dabei eignen sich Linien-, Flächen-oder Balkendiagramme.

Dank diesem Diagramm können bereits diverse Aussagen über die Verkaufsstelle getroffen werden, wie zum Beispiel:

  • Nach 5 Uhr steigt die Anzahl der Verkaufstransaktionen erstmals
  • Ab 8 Uhr ist ein erheblicher Anstieg zu erkennen
  • Um 12 Uhr ist die Spitze des Transaktionsvolumens

Ein weiteres Beispiel von einem anderen Verkaufstag zeigt uns auf, dass wir zwar diverse Aussagen treffen können, jedoch fehlt uns der Kontext zu den historischen Daten.

Folgende Beispielfragen können aktuell nicht beantwortet werden:

  • Entsprechen die Zahlen z.B. um 8 Uhr der Realität?
  • Ist der Ausreißer um 12 Uhr normal?

3. Datenmodell erstellen

Ein Verkaufsleiter schaut sich seine Verkaufszahlen täglich an und entwickelt mit der Zeit ein Gefühl bzw. Erfahrungswerte um das Diagramm in Schritt zwei einschätzen zu können. Als Außenstehende müssen wir uns anderweitig helfen. 

Eine Variante ist, sich mit Hilfe der historischen Daten ein Datenmodell zu berechnen, welche die Erfahrungen des Verkaufsleiters simulieren. 

Datenmodelle können komplex sein und werden in diesem Beitrag nicht im Detail erklärt, weitere Links sind am Schluss des Beitrags vermerkt. Für das Fallbeispiel wurden folgende Schritte vorgenommen um das Datenmodell zu generieren:

  • Berechnung der Transaktionen über die letzten 30 Tage
  • Verwendung der 90te Perzentile um Ausreißer zu glätten
  • Ermittlung der Standardabweichung der Daten

Das Resultat bzw. das Datenmodell zeigt einem die Grenzwerte der verwendeten Daten an. Die Fläche innerhalb der beiden Linien symbolisieren den berechneten Normalzustand – sprich ein positives Bauchgefühl eines Verkaufsleiters.

4. Ausreißer erkennbar machen

Im vierten Schritt werden die aktuellen Verkaufstransaktionen über das Datenmodell gelegt und mittels “Ausreißer”-Diagramm visualisiert. 

Beispiel 1

Beispiel 2

Die hellblaue Fläche bildet den erwarteten bzw. Normalzustand des Systems ab (Schritt 3). Die dunkelblaue Linie zeigt die aktuelle Auslastung (Schritt 2). Solange sich die Linie innerhalb der Fläche befindet wissen wir, dass sich das System in einem guten Zustand befindet. Sobald die Linie die Fläche verlässt wird es mit einem gelben Punkt als Ausreißer gekennzeichnet. Können die Fragen aus Schritt zwei nun beantwortet werden?

Frage #1: Entsprechen die Zahlen z.B. um 8 Uhr der Realität?

Ja, die Linie ist innerhalb der blauen Fläche und somit als realistisch einzuschätzen.

Frage #2: Ist der Ausreißer um 12 Uhr normal?

Nein, der Ausreißer ist nicht normal. Man sieht, dass kurz nach 10 Uhr die Last unerwartet tief ist und 
diverse Ausreißer erkannt werden. Dies weist auf ein potentielles Problem hin. Gemäss einer ersten Einschätzung 
konnte das Problem nach 12 Uhr gelöst werden und die angestauten Transaktionen wurden im nachhinein verarbeitet 
daher die überverhältnismäßige Last.

5. Fazit

Ohne Fachwissen über die Branche, das IT-System oder die eingesetzten Technologien ermöglicht uns dieses Diagramm eine präzise Einschätzung über den Zustand des Systems.

Ein solches Diagramm kann unterschiedlich genutzt werden. Zum Beispiel bietet es Fachspezialisten/innen sowie Laien ein gemeinsames Verständnis über technische Angelegenheiten. Ebenfalls können Fehlzustände generisch und ohne sonstige Fehlerüberwachung erkannt sowie alarmiert werden.


Nützliche Links zum Thema

Beitrag teilen

Roger Joller

System Engineer @ Migros Genossenschafts-Bund

Alle Beiträge ansehen von Roger Joller →

Schreibe einen Kommentar