Aus dem Kurs: Einführung in grundlegende Fähigkeiten für Ihre Karriere in der Datenanalyse

Datentransformation in Power BI

Power BI bietet Datenanalyst:innen zwei Kernfunktionen: das Transformieren und Präsentieren von Daten. Wir möchten die Verkaufszahlen analysieren, um unsere 10 Bestseller zu ermitteln. Diese Daten werden bei einer Besprechung oder später in einem Dashboard visualisiert. Das Startfenster von Power BI Desktop ist eine leere Seite, die breit ist für Visualisierungen. Dazu muss die Verbindung mit Ihren Daten hergestellt werden. Achten Sie auf den Feldbereich ganz rechts, dort habe ich die Tabellen verbunden, die ich für die Analyse brauche. Nämlich Bestelldetails und Produktinfo. Wir erledigen die Transformationen der Produkt- und Auftragstabellen in Power Query. Ich werde mit der Funktion »Gruppieren nach« gleich die Aufträge und Abfragefunktion zusammenfassen, wobei ich die Option »Abfragen zusammenführen« auf Aufträge und Produkte anwende. Meine Daten sind verbunden, also gehe ich zu »Daten transformieren« und beginne zu bereinigen. Ich beginne mit »ProduktInfo«. Für die Analyse der Spitzenprodukte benötige ich nur die Produkt-ID und den Produktnamen. Also Produkt-ID anklicken, Strg-Taste gedrückt halten und Produktname auswählen. Rechtsklick und »Andere Spalten entfernen«. Damit bleiben mir nur die beiden, die ich benötige. Da der Produktname in einer Präsentation möglicherweise besser groß geschrieben ist, fahre ich hierfür mit Rechtsklick und »Transformieren« sowie »Großbuchstaben« fort. Jetzt komme ich zu »Bestelldetails«. Bestelldetails präsentiert die Bestell-ID, die Produkt-ID, der Einzelpreis, wie viel bestellt wurde und den Rabatt. Zuallererst muss ich die Funktion erstellen, die mir den Gesamtbetrag abzüglich des Rabatts berechnet. OK. Erst »Spalte hinzufügen« und dann »Benutzerdefinierte Spalte« auswählen. Der Titel ist »Bestellsumme«. In der Anweisung erstelle ich die Zwischensumme, berechne den Rabatt und ziehe sie dann voneinander ab. Mathematisch gibt es mehrere Möglichkeiten. OK. Ich klicke auf OK. Und jetzt habe ich meine Menge multipliziert mit meinen Einzelpreis minus den Rabattbetrag. Dies soll eine feste Dezimalzahl sein. Wunderbar. Das ist also meine Bestellsumme. Mit der Funktion »Zusammenführen« erstelle ich die Abfrage, die Produktinfo und Bestelldetails zusammenführt. Erst auf »Produktinfo« klicken. Dann zur Registerkarte »Start« gehen. Hier habe ich »Abfragen zusammenführen«. Wir haben hier zwei Optionen. »Abfragen zusammenführen« oder »Abfragen als neue Abfrage zusammenführen«. Mit »Abfragen zusammenführen« kann ich Daten direkt in Produktinfo zusammenführen. »Abfragen als neue Abfrage zusammenführen« ergibt ein drittes Objekt zum Arbeiten. Für die heutige Beispiel-Analyse muss ich einfach »Abfrage zusammenführen« ausführen. Ich kann diese Daten direkt in Produktinfo zusammenführen. Das ist das Fenster »Zusammenführen«. Ich möchte »Produktinfo« mit »Bestelldetails« zusammenführen. Produkt-ID ist das gemeinsame Feld, das unbedingt bei beiden markiert sein muss. Wie alle anderen Datensätze sind auch die Verknüpfungstypen oder Join-Typen hier. Wenn Sie an den unteren Bildschirmrand schauen, steht dort »Join-Art«. Wie Sie sehen, stimmen 75 Datensätze mit 77 Zeilen aus der ersten Tabelle überein. Ich habe also zwei Produkte ohne Datensätze, weil sie noch nicht bestellt wurden. Das ist in Ordnung. Wir sehen uns Spitzenprodukte an, also wären natürlich alle schon bestellt worden. Klicken wir auf das Dropdownfeld. »Linker äußerer Join« würde mir die aktuelle Ansicht zeigen. Alle Produkte und ob eine Bestellung vorliegt. »Rechter äußerer Join« zeigt alle Bestelldetails an, unabhängig von der Produktübereinstimmung. »Vollständiger äußerer Join« würde alle Zeilen anzeigen, sowohl von Produkten als auch von Bestelldetails ohne übereinstimmende Datensätze. »Innerer Join« zeigt Produkte mit Bestellungen, was ich hier benötige. »Rechter Anti-Join« und »Linker Anti-Join« zeigen einfach die Nullwerte an. »Linker Anti-Join« würde nur die beiden Produkte auflisten, die keine Bestelldetails haben. Für meine Spitzenanalyse benötige ich »Innerer Join«. Weiter per Klick auf OK. Jetzt kann ich meine Tabelle erweitern. Ich klicke hier auf erweitern. »Ursprünglichen Spaltennamen als Präfix verwenden« ist eine optionale Einstellung. Ich benötige nicht alle Spalten. Ich benötige nur die Bestellsumme. Ich kann jetzt auf OK klicken. Jetzt sehe ich den Produktnamen und die Bestellsumme. Jetzt bin ich bereit, sie zu gruppieren. Jetzt sind »Gruppieren nach« und »Summe nach« einzelnem Produkt mögliche Funktionen. Ich gehe zum Register »Transformieren«. Und dann zu »Gruppieren nach«. OK. Ich möchte nach dem Produktnamen gruppieren und einen Gesamtbetrag der Bestellsumme erstellen. Dadurch wird jede einzelne Position erfasst und nach Produkt summiert. Das ergibt die gesammte Bestellsumme. Weiter per Klick auf OK. Jetzt sehe ich jeden Produktnamen und wie viel bestellt wurde. OK. In meiner Visualisierung muss ich eigentlich nur Produkte anzeigen. Bestelldetails sollen also nicht geladen werden. Ich verwende sie in keinen Visualisierungen, also weiter. Ich gehe weiter zu Start und bin bereit, den Datensatz in die Visualisierungsseite zu übernehmen. In der Feldliste ist jetzt die Produktinfo zu sehen. Ich visualisiere dies in einer Tabelle. Also wähle ich »Tabelle«. Und dann ziehe ich »Produktname« und »Gesamt« zu »Werten«. Ich passe die Größe an, um es zu sehen. Hier wird jedes einzelne Produkt dargestellt. Wir versuchen, auf die ersten 10 zu kommen. Ich gehe zu den Filtern bei »Produktname«. Ich filtere die top N, also die oberen 10. Ich stütze das auf das »Gesamt«. »Gesamt« also zu »Nach Wert« ziehen und den Filter anwenden. Nach Anwendung des Filters sehe ich die top 10 Produkte. Als Nächstes sortieren wir sie per Klick auf diesen Gesamt-Header. Diese Methoden und Joins zeigen Ihnen genau, was Sie mit Bereinigungsroutinen alles aus Power BI und Daten für Präsentationen herausholen können.

Inhalt