Jakość kolumn i rozkład kolumn to rozwiązanie znajdujące się wewnątrz Edytora zapytań Power Query w Power BI (być może wkrótce też w Excelu), o którym wspominałem podczas #21 spotkania Data Visualization & BI Meetup. Kolejnym dołożonym elementem jest Profilowanie kolumn, które pozwala szybciej zajrzeć w dane i wykonać na nich dodatkowe operacje.
Podgląd danych
Wchodząc do Edytora kwerend w kartę Widok ,w sekcji Podgląd danych znajduję trzy opcje: Rozkład kolumn, Profil kolumny, Jakość kolumn.
Rozkład kolumn
Rozkład wartości (unikatowych oraz odrębnych) oraz ich liczba, w każdej z kolumn jest zaprezentowany graficznie.
Jakość kolumn
Pokazuje jak rozkładają się procentowo wartości w poszczególnych kolumnach , w kategoriach prawidłowe, błąd oraz puste. Jakość danych w kolumnie prezentowana jest również na pasku, pojawiającym się zaraz pod nazwą kolumny.
Kolor zielony świadczy o prawidłowości danych, domieszki innych sugerują braki lub błędy.
Profil kolumny
To nowa funkcjonalność, która dokładniej pozwala przedstawić zawartość wybranej kolumny:
– Statystyki kolumn – dostępne po lewej stronie okna, w zależności od typu danych (tekstowe, liczbowe, data) w kolumnie mogą się pojawić inne miary. Znajdę tu m.in. liczba elementów, liczba błędów, pustych, minimum, maksimum, średnia, mediana, odchylenie standardowe
– Rozkład kolumn – widoczne po prawej stronie okna, jest to powiększona wersja histogramu widocznego przy włączonej opcji Rozkład kolumn (omawianej wyżej w artykule). Posiada dodatkową funkcjonalność, wybierając jedną z kolumn histogramu , pojawia się okno z opcją Zachowaj/ Usuń . Jest to możliwość modyfikowania filtrów na danej kolumnie:
– Zachowaj > powoduje założenie filtru, z wybraną wartością na kolumnie
– Usuń > powoduje odznaczenie danej wartości z filtrów w kolumnie
Krok filtrowania pojawia się również po prawej stronie wśród Zastosowanych kroków analizowanego zapytania.
Profilowanie kolumn na podstawie wybranej bazy wierszy
Do tej pory możliwe było profilowanie kolumn jedynie na podstawie 1000 pierwszych wyświetlanych wierszy. Aktualnie dzięki wprowadzonym zmianom profilowanie dostępne jest także, dla całego zestawu danych. Przełączenie tej opcji dostępne jest na dole Edytora kwerend.
Przejście od obrazu do działania
Power Query pozwala umożliwia też wykonanie od razu na widoku profilu kolumny podstawowe operacje, takie jak:
- filtrowanie
- operacje na błędach
- praca na duplikatach
- usuwanie pustych
- zamiana wartości
- kopiowanie dystrybucji w postaci tabeli do Excela
Czekamy na kolejne funkcje i ich wprowadzenie także do Excela.