Aus dem Kurs: Einführung in grundlegende Fähigkeiten für Ihre Karriere in der Datenanalyse

Datenquellen und Datenstrukturen

Ist etwa nicht ständig von Daten die Rede? Aber was bedeutet das eigentlich? Beginnen wir mit den Grundlagen. Daten haben einen Wert, z. B. Ihren Geburtstag. Angenommen der 20. Nov. eines Jahres, dann ist der Wert der 20.11 dieses Jahres. Es gibt Datentypen, wie etwa den Datumstyp für Geburtstage. Und sie haben einen Feldnamen, wie etwa GD für Geburtsdatum. Ein Datensatz besteht aus mehreren Feldern wie etwa Vor- und Nachname und Geburtsdatum. Auf Arbeitsblättern arbeiten wir die ganze Zeit mit Datensätzen, oft ohne die hinterlegte Tabelle zu beachten. Auch in einer Datenbank sind verbundene Felder in Tabellen samt Namen, Werten und Datentypen gespeichert. Vervollständigen wir diese Informationen für eine Person, haben wir einen Datensatz. In Tabellen lassen sich mehrere Typen von Daten sehr gut strukturiert erfassen. So ist das Speichern von Daten viel flexibler möglich als auf einem Arbeitsblatt. Analyst:innen verwenden für ihre Berichte Daten, die in verschiedenartigen Systemen erfasst und gespeichert sind. Ja nach Unternehmen können das Arbeitsblätter, Datenbanken oder sogar Data Warehouses sein. Data Warehouses sind eigentlich Datensysteme mit aufbereiteten Tabellen aus Produktionssystemen, wie etwa dem Einkaufssystem. Auch in angepassten oder spezifischen Softwaresystemen werden für Berichte nur bestimmte der Hunderten Tabellen und Einzelheiten einer Datenbank benötigt. Diese werden von einem Data-Warehouse-Profi bereinigt und zur Speicherung und Sicherung in das Warehouse gebracht. Es ist eine wertvolle und geprüfte Quelle gut strukturierter Daten, die Analyst:innen für ihre Berichte verwenden können. Strukturierte Daten in Tabellen und schön gestalteten Warehouses sind eine tolle Sache, aber Daten sind nicht immer strukturiert. Diese Rohdaten lassen sich in Data Lakes erfassen, um sie vor Ihrer Aufbereitung für benötigte Berichte zu speichern. Wenn das Design von Datenbanken oder Datenlösungen Ihr Ding ist, dann sind Fähigkeiten im Bereich Data Warehouses, Data Lakes oder Data Lake Houses für Sie interessant. Datenanalyst:innen beziehen eher Daten aus diesen Systemen, statt sie zu erstellen. Als Datenanalyst:in arbeiten Sie mit allerlei Systemen und Dateitypen. Als Einsteiger:in erwarten Sie viele Arbeitsblätter und CSV-Dateien, bevor Sie mit Daten in größeren Datensystemen arbeiten. Gute Arbeitsblätter werden auf jedem Niveau gerne genommen, um Daten zu analysieren, aber nicht, um sie zu speichern.

Inhalt