Power Query, Daten mit Power Query importieren und bereinigen
Wenn Sie regelmäßig mit verschiedenen Datenquellen und -formaten arbeiten, dann wissen Sie, dass diese selten im benötigten Format / Struktur daherkommen.
Power Query (ab Excel 2016 auch Get & Transform genannt) ist hierfür die Lösung.
Power Query ist ein verblüffendes ETL tool (Extrahieren, Transformieren und Laden). Wenn Sie es nicht nutzen, dann verpassen Sie eines der besten neuen features in Excel.
Power Query kann sich über sogenannte Konnektoren mit vielen verschiedenen Datenformaten verbinden.
In diesem Beitrag werden wir Daten aus einer CSV Datei importieren, der Fokus liegt hierbei auf
grundlegenden Bereinigungs- und Transformations Operationen, welche oft notwendig sind, um ungeordnete Daten in Form zu bringen, um eine weitere Verarbeitung erst zu ermöglichen (Datenmodellierung, Kennzahlenbildung, Analysieren und Visualisieren)
Die Daten
Ausgangslage
Es gibt einige offensichtliche Probleme mit den Daten die wir importieren wollen.
Diese müssen zuerst gefixt werden, bevor die Daten ihrer angedachten Verwendung zugeführt werden können.
1 Die Daten wurden je Datum aggregiert (pivotiert, Summe). Das Datum taucht nur einmal pro Datenset auf.
2 Es gibt führende Leerzeichen (BLANK) vor jedem Lieferanten, welche entfernt werden müssen
3 Der Name der Lieferanten und dessen ID wurden verkettet, sie stehen in einer Zelle.
4 Es gibt Datenreihen, die keine Informationen enthalten, diese müssen entfernt werden
5 Einkaufsvolumina für die unterschiedlichen Lieferanten wurden in 4 Warengruppen pivotiert.
Wir wollen das Einkaufsvolumen in einer Spalte mit einer Extra Spalte, welche die Warengruppen definiert.
6 Es gibt Zeilen mit Gesamtwert, welche entfernt werden sollen.
Datenimport
Wir befinden uns nun im Power Query Editor und können mit den Datentransformationen beginnen,
um unsere Daten in eine geeignete tabellarische Form zu bringen.
Jede Transformation, welche auf die Daten angewendet wird, wird als angewandter Schritt dokumentiert. Man kann vor und zurück gehen, indem man auf einen Transformationsschritt klickt.
Jeder Verarbeitungsschritt ist dokumentiert und kann bei Bedarf von einem verständigen Dritten nachvollzogen werden
Power Query (ab Excel 2016 auch Get & Transform genannt) ist hierfür die Lösung.
Power Query ist ein verblüffendes ETL tool (Extrahieren, Transformieren und Laden). Wenn Sie es nicht nutzen, dann verpassen Sie eines der besten neuen features in Excel.
Power Query kann sich über sogenannte Konnektoren mit vielen verschiedenen Datenformaten verbinden.
In diesem Beitrag werden wir Daten aus einer CSV Datei importieren, der Fokus liegt hierbei auf
grundlegenden Bereinigungs- und Transformations Operationen, welche oft notwendig sind, um ungeordnete Daten in Form zu bringen, um eine weitere Verarbeitung erst zu ermöglichen (Datenmodellierung, Kennzahlenbildung, Analysieren und Visualisieren)
Die Daten
Ausgangslage
Es gibt einige offensichtliche Probleme mit den Daten die wir importieren wollen.
Diese müssen zuerst gefixt werden, bevor die Daten ihrer angedachten Verwendung zugeführt werden können.
1 Die Daten wurden je Datum aggregiert (pivotiert, Summe). Das Datum taucht nur einmal pro Datenset auf.
2 Es gibt führende Leerzeichen (BLANK) vor jedem Lieferanten, welche entfernt werden müssen
3 Der Name der Lieferanten und dessen ID wurden verkettet, sie stehen in einer Zelle.
4 Es gibt Datenreihen, die keine Informationen enthalten, diese müssen entfernt werden
5 Einkaufsvolumina für die unterschiedlichen Lieferanten wurden in 4 Warengruppen pivotiert.
Wir wollen das Einkaufsvolumen in einer Spalte mit einer Extra Spalte, welche die Warengruppen definiert.
6 Es gibt Zeilen mit Gesamtwert, welche entfernt werden sollen.
Datenimport
Wir befinden uns nun im Power Query Editor und können mit den Datentransformationen beginnen,
um unsere Daten in eine geeignete tabellarische Form zu bringen.
Jede Transformation, welche auf die Daten angewendet wird, wird als angewandter Schritt dokumentiert. Man kann vor und zurück gehen, indem man auf einen Transformationsschritt klickt.
Jeder Verarbeitungsschritt ist dokumentiert und kann bei Bedarf von einem verständigen Dritten nachvollzogen werden
Daten in Spalten aufteilen (Split)
Leere Zellen auffüllen (Fill Up, Fill Down)
Lieferant und Nummer aufteilen (Split)
führende Leerzeichen für den Namen entfernen (Trim)
nicht benötigte Zeilen entfernen (Remove)
Spalten umbenennen
Doppelklick auf Spalte(n)
Entpivotierung der Spalte [Warengruppe] (Unpivot)
Datentypen ändern (Change Datatype)
Schließen und Daten in eine Exceltabelle laden (Close and Load)
Query mit neuen Daten updaten
Lern Video
Kommentare
Kommentar veröffentlichen