Aus dem Kurs: Einführung in grundlegende Fähigkeiten für Ihre Karriere in der Datenanalyse

Stammdatenmanagement

Ist Ihnen bei der Arbeit mit Adressdaten schon aufgefallen, dass unterschiedlich auf Regionen verwiesen wird? Wenn sie in Daten verwendet und von verschiedenen Personen eingegeben werden kann auf Staaten, Länder oder Bezirke entweder in ausgeschriebener oder abgekürzter Form verwiesen werden. Daten wie Kunden- und Adressinformationen sind Stammdaten. Jede und jeder in der Organisation, die mit diesen Daten arbeitet, sollte die gleiche einheitliche Liste der Informationen haben. Wird in einer Organisation Zeit aufgewendet, um Stammdatenregeln zu definieren, so wissen Datenanalyst:innen auch, welche Arten von Transformationen anzuwenden sind. Mit Tools wie Power Query können wir diese Korrekturen leicht entweder in Excel oder Power BI vornehmen und die Schritte speichern, sodass neue Daten in unseren Berichten den Standards entsprechen. Stammdaten sind aber nicht nur Adressinformationen. Es können Projekt- oder Produktnamen sein. Wenn ein Projekt von allen Beteiligten anders genannt wird, dann macht es dies für Datenanalyst:innen schwer, diese Informationen einfach zu berichten. Es gibt Tools, die dazu da sind, das Stammdatenmanagement großer Organisationen zu unterstützen. Ich würde aber unabhängig von der Größe behaupten, dass Stammdaten Sache der Analyst:innen sind, sofern kein Plan existiert. Stammdatenmanagement dient dazu, eine saubere, vollständige und richtige Liste der Stammdaten für eine Organisation zu führen. Ohne es müssen Sie einen Plan ausarbeiten, um eine schöne einheitliche Liste von Daten zu führen, wenn Sie Berichte erstellen. Nehmen wir Produkte als Beispiel. Zwei Unternehmen haben fusioniert. Sie verkaufen genau die gleichen Produkte, nennen sie aber anders. Als Datenanalyst:in können Sie mit einer Tabelle, die alle möglichen und den richtigen Namen enthält, Joins nutzen, um Ihnen eine Stammtabelle der Informationen zu geben, wenn Sie einen Bericht erstellen. Wenn ein neuer Name auftaucht, müssen Sie ihn in Ihrer Stammtabelle klären. Aber diese Tabelle zu haben, ist besser als nichts. Ein sauberer und vollständiger Datensatz ist eines der wichtigsten Teile jedes Projekts. Denken Sie daran: Sie können alle Ihre Datenqualifikationen auf allerlei Arten von Datenszenarios anwenden, nicht nur auf Analyse und Präsentation.

Inhalt