Aus dem Kurs: Einführung in grundlegende Fähigkeiten für Ihre Karriere in der Datenanalyse

Datenregeln verstehen

In der Geschäftswelt ist oft von Geschäftsanforderungen zu hören. Was wir tun, wird dahingehend bei jedem Projekt kontrolliert. Ihre Erfüllung besteht teils darin, die Geschäftsregeln zu verstehen. Es ist bei der Arbeit mit Daten generell wichtig, die damit verbundenen Regeln zu verstehen. Sie können uns sagen, wann Daten zu erwarten sind, was mit Daten zu tun ist, die gewisse Kriterien erfüllen, und erklären auch, was bei ihrer Transformation zu geschehen hat. Gehen wir einige Geschäftsregeln durch und wie Daten davon betroffen sind. Zunächst sollten wir verstehen, was mit Regeln gemeint ist. Geschäftsregeln können einfach eine Definition sein. Sind Vertriebskontakte Kund:innen oder Interessenten? Eine einfach Regel wäre, jemand als Kund:in zu definieren, sobald er oder sie eine Bestellung aufgegeben hat. Auch der Datenfluss ist regelgeleitet. Haben wir im System einen Auftragsdatensatz, so ist die Bestellung erfolgt. Interessent:in und potenzieller Verkauf sind also in einer bestimmten Phase des Prozesses. Somit lassen sich potenzielle und tatsächliche Verkäufe leicht unterscheiden. Dies ist ein Beispiel für eine einfache Geschäftsregel. Mit dieser Regel und Daten können Interessent:innen in Kund:innen konvertiert werden. Es gibt auch spezifischere Regeln mit technischen Anforderungen. Wir habe einige Auftragsdaten. Diese Daten sollen in ein neues System gespeist werden, das zusätzliche Berichtsfunktionen für Aufträge bereitstellt. Diese Informationen gehen in die Produktion. Wir müssen die Daten also vorbereiten, um sie in das neue System einzuspeisen. Wir möchte die Daten also zu Berichtszwecken in ein anderes System übertragen. Mit einer Vorlage bringen wir die Daten aus unserem System mit den Datenspezifikationen des Zielsystems in Einklang. Für unsere Daten erhielten wir ein Dokument mit technischen Anforderungen. Lesen wir es doch schnell durch. Zunächst muss unsere Auftrags-ID in einen Text-Datentyp konvertiert werden, aber ohne Buchstaben. Keines der Datenfelder darf Zeitstempel enthalten. Wir brauchen eine Sachkontonummer des Hauptkontos. Diese besitzt einen 4-stelligen Code für die Buchhaltung, die beiden Endziffern bezeichnen die Kategorie. Außerdem sollen Regionen-ID und Kommentarfelder entfernt werden. Zuletzt sind unsere Daten für den Import in das neue Berichtssystem in einer CSV-Datei, einer Datei mit Trennkommas zu speichern. Jetzt haben wir alle technischen Anforderungen. Sehen wir uns nun die Daten an. Laut Geschäftsregel und Tech-Anforderungen müssen Auftrags-ID und Zahl text-Datentypen sein. Ich sehe sogleich, dass die Auftragsnummer ein Zahl-Datentyp ist. Ich weiß das, weil sie im Feld rechtsbündig ist. Die AuftragNummer ist linksbündig, also bereits ein text-Datentyp. Aber die beiden Buchstaben erfüllen die Anforderungen nicht. A und U für Auftrag. Nun zu den Datumsangaben. Da sind eindeutig Zeitstempel enthalten, um die Regel zu erfüllen, müssen meine technischen Anforderungen also eine Datenbereinigung vorsehen. Laut Spezifikationen ist eine Sachkontonummer des Hauptkontos erforderlich. Gemein ist der 4-stellige Code für die Buchhaltung, mit zwei Endziffern für die Kategorie. Aber sich sehe in den Daten keine Sachkontonummer des Hauptkontos. Da ich die Geschäftsregeln zu den Kontonummern dieser Datensätze kenne, könnte ich die Sachkontonummer des Hauptkontos daraus erstellen. Ich sehe auch auszuschließende Spalten. Nämlich Region-ID und Kommentar. Sie sollten bei der Arbeit an jedem neuen Datenprojekt unbedingt die Regeln der Organisation in Bezug auf Datendefinitionen berücksichtigen. Zudem sind der Datenfluss und spezifische technische Anforderungen zu berücksichtigen.

Inhalt