12 grudnia 2017 r. prowadziłem w Warszawie #18 spotkanie entuzjastów analizy i wizualizacji danych w ramach grupy Data Visualization & BI Meetup. Tematem spotkania była automatyzacja procesu przygotowania danych w Power Query – edytorze zapytań, który znaleźć można zarówno w programie Excel, jak i w Power BI. Tytuł spotkania brzmiał: „3 transformacje w Power Query & Power BI”. W poniższym wpisie znajdziesz krótkie podsumowanie oraz materiały do pobrania.
Transformacja 1: Unpivot
Operacja Unpivot, przetłumaczona w polskim interfejsie jako Anuluj przestawienie kolumn (?!), pozwala „odkręcić” dane, pozostawione w układzie przestawnym. Omawiane w czasie spotkania scenariusze obejmowały zarówno jednopoziomowy, jak i wielopoziomowy unpivot.
Unpivot prosty
PRZED
PO
Unpivot złożony
PRZED
PO
Transformacja 2: Grupowanie
Grupowanie może być wykorzystywane w wielu celach, m.in.:
- sprawdzenie słowników danych lub podsumowań
- wstępna agregacja danych, zmniejszającą ich ilość
- dalsze wykorzystanie danych zgrupowanych (np. jako filtr)
PRZED
PO
Transformacja 3: Scalanie
Scalanie jest kluczową operacją w Power Query, gdyż potrafi zastąpić WYSZUKAJ.PIONOWO, dając znaczenie więcej możliwości. Operacja ta jest odpowiednikiem operacji JOIN w języku SQL. Na spotkaniu przeszliśmy przez 6 typów scalania.
Bonus
Przygotowałem też zadanie bonusowe pokazujące, że w Power Query można procesować dane różnymi ścieżkami, a później łączyć je w jeden zbiór. Przykład bonusowy polegał na oddzielnym procesowaniu danych, które generowały błędy.
Materiały do pobrania
Wszystkie przykłady omówione na spotkaniu oraz towarzyszące im dane źródłowe możesz pobrać tutaj: Materiały po #18 Meetup.
W przykładach podmień ścieżkę plików źródłowych.