Aus dem Kurs: Einführung in grundlegende Fähigkeiten für Ihre Karriere in der Datenanalyse

Datentransformationen mit Power Query in Excel

Aus dem Kurs: Einführung in grundlegende Fähigkeiten für Ihre Karriere in der Datenanalyse

Datentransformationen mit Power Query in Excel

Wir wurden beauftragt, uns anzusehen, wie lange unsere Lieferantentransaktionen vom Transaktions- zum Abschlussdatum dauern. Wir möchten sehen, ob eine gegebene Transaktion irgendwo länger dauert. Wir hoffen, dass die Transaktionsdauer meistens unter drei Tagen bleibt. Wir haben alle erforderlichen Daten, aber nicht alle Berechnungen, um die Analyse durchzuführen. Machen wir erst ein paar Transformationen, dann die erforderlichen Berechnungen. OK. Ich gehe zu »Abfragen und Verbindungen« und bearbeite meine Lieferfirmenabfrage. Für einige Transformationen hätte ich normalerweise Funktionen in Excel erstellen müssen, aber mit Power Query kann ich diese Funktionen ausführen, ohne eine Funktion erstellen zu müssen. Zuerst zeige ich Ihnen die Lieferfirmen. Für unsere Zwecke müssen alle Lieferfirmen in Großbuchstaben geschrieben sein. Ich transformiere diese Spalte also in Großbuchstaben. Wir benötigen das Transaktionsdatum, aber auch das Transaktionsjahr. Ich öffne das Kontextmenü mit einem Rechtsklick. Ich dupliziere diese Spalte und transformiere sie zu Jahren. Also im Kontextmenü »Transformieren« und dann »Jahr« wählen und nochmal »Jahr« wählen. Ich nenne die Spalte »Transaktionsjahr«. Und verschiebe sie einfach neben das Transaktionsdatum. Ich habe hier zwei Beträge. Ich habe den Betrag ohne Steuern und den tatsächlichen Steuerbetrag. Ich benötige eigentlich den Gesamtbetrag. Also erstelle ich meine erste Formel. Ich gehe zu »Spalte hinzufügen«, wähle dann »benutzerdefinierte Spalte« und nenne sie »SummeGesamt«. Also rechts durch die Spalten scrollen, auf »Nettobetrag« doppelklicken, Pluszeichen hinzufügen und auf »Steuer« doppelklicken. Es werden keine Syntaxfehler angezeigt, also klicke ich OK. Jetzt ändere ich dies zu Datentyp »Währung«. Ich benötige nur den Gesamtbetrag, also mit der rechten Maustaste auf »Nettobetrag« und »Entfernen«. Die »Steuer« kann auch weg. Jetzt möchten wir uns die Zeit in Tage zwischen dem Transaktionsdatum und dem Lieferdatum ansehen. Fügen wir eine weitere Spalte ein. Eine benutzerdefinierte Spalte mit Titel »Tage«. Ich wähle Transaktionsdatum minus Lieferdatum und klicke auf OK. Diese Methode ergibt die Anzahl der Tage, aber weil das Transaktionsdatum vor dem Lieferdatum lag, wird ein negativer Wert angezeigt. Es sieht auch nicht wie eine Zahl aus. Eher wie ein Zeitstempel. Ich ändere es also zu einer ganzen Zahl. Und eigentlich suche ich den absoluten Wert. Also Rechtsklick und dann auf »Transformieren« und dann »Absoluter Wert«. Jetzt fehlen mir nur noch die Felder, die mir zeigen, ob dieser Zeitraum über oder unter drei Tage lang ist. Dafür nehme ich eine bedingte Spalte. Die Tage sollen erfasst und dann über oder unter drei Tage als Text erscheinen. Also eine bedingte Spalte« ich nenne sie »MehrWeniger«. Ich wähle Tage. Und ist es größer oder gleich drei Tage, soll stehen: »drei Tage oder mehr«. Für alles, das zwei Tage oder kleiner ist, soll stehen »zwei Tage oder weniger«. Durch diese Logikfunktion werden die Tage erfasst. Sie hat die Werte »Wahr« oder »Falsch«. In Excel entspräche dies in etwa einer Wenn-Funktion. Ich bestätige mt OK. Jetzt bin ich bereit, meine Analyse zu starten. Ich gehe zum Startmenü. Ich wähle »Schließen und laden«. Also gut. Alle meine neu hinzugefügten Spalten sind da und mein Lieferfirmen sind automatisch groß geschrieben. Das ist fantastisch. Jetzt kann ich ermitteln, ob meine Lieferfirmatransaktionen über oder unter drei Tage dauern. Wir können mit diesen Daten einige gängige Fragen zu den Produktionstagen beantworten. Erst fügen wir eine Pivottabelle ein. Also »Einfügen« und »Pivot table«. Es wird mein Lieferfirmenbereich auf einem neuen Arbeitsblatt verwendet. Perfekt. Die »MehrWeniger«-Spalte unter »Zeilen« ablegen. »LieferfirmaTransaktionsID« unter »Werte« ablegen. Weil es eine Zahl ist, wird sie automatisch summiert. Ich ändere es also zu einer Anzahl. Ich klicke auf OK. Der Blick auf die Zahlen zeigt, dass die meisten Transaktionen drei Tage oder länger dauern. Schnell noch ein weiterer Analyseschritt. Ich kann rechtsklicken. Und den Wert als Prozentsatz des Gesamtergebnisses anzeigen lassen. Dieses allgemeine Detail zeigt uns, dass die Transaktionsdauer in 69 % der Fälle drei Tage oder mehr beträgt. Nur rund 31 % liegen unter drei Tagen. OK. Es gibt noch einige Analysen zu tun. Daten zu transformieren kann bedeuten, allerlei kleine Methoden auf Daten anzuwenden, bevor Sie zu Ihrer Analyse kommen.

Inhalt