Aus dem Kurs: Einführung in grundlegende Fähigkeiten für Ihre Karriere in der Datenanalyse

Bestehende Daten entdecken und interpretieren

Aus dem Kurs: Einführung in grundlegende Fähigkeiten für Ihre Karriere in der Datenanalyse

Bestehende Daten entdecken und interpretieren

Haben Sie sich schon einmal überlegt, wie viele persönliche Daten es gibt? Es sind mehr als gedacht. Zum Beispiel Geburtsdatum, Name und Ethnizität. Oder Arbeitsdaten wie Mitarbeiterkennung, Berufsbezeichnung, Einstellungsdatum und Abteilung. An diese Elemente denkt man doch, wenn man mit Daten zu Personen arbeitet. Manche haben genau einen Wert, etwa Ihr Geburtsdatum. Dieser Wert ist und bleibt derselbe. Dann haben Sie andere Elemente wie etwa Berufsbezeichnung, die sich möglicherweise ändern, wenn Sie befördert werden. Es gibt auch Echtzeitdaten, die ständig laufen. Wie etwa Herzfrequenz, Glukosespiegel, Blutdruck und Temperatur. Es gibt auch geografische Daten, wie etwa den Standort. Denken Sie an soziale Daten: z. B. welchen Marken wir folgen, welche wir kaufen, wie oft wir Essen bestellen statt auszugehen. Der Datenstrom steht nie still. Datenanalyst:innen stehen vor der Herausforderung, dass es viele potenzielle Daten gibt und sie nicht alle verfügbar sind. Wir sehen auch, dass Daten redundant und in manchen Fällen auch unvollständig oder falsch sein können. Alle suchen nach der einzigen Quelle der Wahrheit, denn wir wollen, dass Daten stimmen, wenn wir Berichte damit generieren. Ich geben Ihnen ein paar Beispiele. In Unternehmen wird mit mehreren verschiedenen Softwarepaketen gearbeitet, um verschiedenartige Informationen zu bearbeiten, und diese Pakete sind oft getrennt. Es gibt Personalverwaltungssoftware, mit der alle Informationen verarbeitet werden, die sich auf Mitarbeitende beziehen, was unseren Personaldaten entspricht. Es gibt Marketing- und Vertriebsverwaltungsdaten, die in unterschiedlichen Systemen gespeichert sind, die nicht nur Personal- sondern auch Kundendaten verarbeiten. Bestimmte Software wird aktiviert, wenn Kund:innen nach einem Gespräch mit dem Verkaufsteam dazu übergehen, etwas von dem Unternehmen zu kaufen. Daten fließen vom Verkauf zum Lager. Andere Daten fließen in die Buchhaltung, um Transaktionen für Berichte zu verarbeiten, z. B. zum Ausweis von Gewinn und Verlust. Daten fließen also zu unterschiedlichen Zeiten durch die Organisation. Da diese Systeme oft getrennt sind, besteht eine der ersten Herausforderungen darin, herauszufinden, wo die Daten am genausten sind. Ermitteln lässt sich dies nur durch Fragen nach Beginn der Untersuchung. Manchmal gibt es Hindernisse in Form von Berechtigungen und Vertraulichkeit. Vielleicht benötigen Sie zur Bestätigung Ihrer Werte gespeicherte Daten aus der Buchhaltungssoftware, auf die nur das Buchhaltungsteam Zugriff hat. Auch ohne direkten Zugriff können Sie weitermachen, indem Sie diesen Teams Ihre Werte zur Validierung bereitstellen. Ob verbunden oder nicht – Informationen sollten in der Praxis systemübergreifend identisch sein. Meldet Ihr Verkaufsteam, dass diesen Monat 100.000 Euro fakturiert werden, so sollten in der Buchhaltungssoftware Rechnungen im Wert von 100.000 Euro ausgewiesen sein. Wenn die Zahlen nicht übereinstimmen, müssen Sie herausfinden, wo der Fehler liegt. Als Datenanalyst:in müssen Sie sich überlegen, auf welche Art von Daten Sie stoßen können, dann die Daten finden, auf die Sie Zugriff haben, und Strategien entwickeln, um Ihre Berichte zu validieren. Es ist Ihre Aufgabe, die richtigen Daten aus verschiedenen Quellen zusammenzuführen.

Inhalt