Najlepszym sposobem wizualizacji danych mających odniesienie geograficzne to przedstawienie ich na mapie. Microsoft wie o tym doskonale od dawna, dlatego możliwość przedstawiania danych na różnego rodzaju odwzorowaniach powierzchni Ziemi jest rozwijana już od dość dawna – opcje takie pojawiały się w dodatku Power View, a nawet został stworzony do tego osobny dodatek do Excela – Mapa 3D (pierwotnie Power Map). Tak istotnego sposobu prezentacji danych nie mogło zabraknąć także w Power BI.
W omawianym narzędziu mamy do wyboru kilka wizualizacji danych przestrzennych:
- Mapa (czyli wykres bąbelkowy na podkładzie mapowym – kartodiagram);
- Kartogram,
- Mapa kształtów,
- Mapy ArcGIS dla usługi Power BI,
- Niestandardowe wizualizacje (Mapbox, Drilldown Choropleth, Route Map, Flow Map, mapy generowane skryptem R i inne).
Każdy z tych sposobów wizualizacji ma nieco inną charakterystykę, implikującą ich wykorzystanie. W niniejszym tekście znajdzie się opis dwóch podstawowych wizualizacji – Mapę oraz Kartogram.
Mapa w Power BI
Pod tą ogólną nazwą w Power BI kryje się kartodiagram kołowy – jest to sposób przedstawiania wybranych danych przy pomocy wykresu kołowego naniesionego na odpowiednie miejsce na mapie na przykład miasto bądź województwo. Sposób ten służy do prezentacji danych bezwzględnych, takich jak zysk z danego obszaru czy też liczba mieszkańców. W opozycji do tego typu danych stoją dane względne, czyli takie które obrazują udział interesującej nas cechy w odniesieniu do ogółu – do takich zestawień możemy zaliczyć liczbę wegetarian przypadającą na ogół ludności na danym obszarze, czy też liczbę maszyn rolniczych przypadających na powierzchnię pól w danym powiecie bądź województwie.
W Power BI mamy do wyboru kilka różnych wariantów przedstawiania danych przy pomocy kartodiagramu – wynika to z opcji dostępnych użytkownikowi we wstążce Wizualizacje, zakładce Pola:
Obszary definiujące charakter naszych diagramów kołowych będących składowymi kartodiagramu to pola Legenda, Rozmiar oraz Nasycenie koloru.
Pole Rozmiar odpowiada oczywiście za rozmiar bąbelka w danym punkcie. Wielkość diagramu jest najczęściej wykorzystywaną zmienną w tego typu wizualizacjach – w prosty sposób pokazuje wielkość zjawiska.
Wartość liczbowa jest pokazywana przez powierzchnię koła, ale trzeba z tym uważać, gdyż wizualizacja ma problem ze skalowaniem przy dużych różnicach między punktami.
Warto zauważyć, iż przy zastosowaniu wykresu bąbelkowego pojawia się pewna trudność w porównywaniu lokacji między sobą – dość łatwo jest powiedzieć który bąbelek jest większy, ale trudno jest oszacować o jaką wartość (pisałem o tym w artykule o wykresie bąbelkowym). W takich przypadkach niezbędne jest zaimplementowanie interakcji details on demand – szczegóły na żądanie. Znajdziemy ją także w Power BI – wystarczy najechać kursorem na interesujące nas koło, aby wyświetliły się szczegółowe dane.
Kolejnym atrybutem pozwalającym na zaprezentowanie wartości jest nasycenie koloru: Im bardziej nasycony kolor, tym większą wartość prezentuje. Oczywiście oszacowanie wartości na podstawie nasycenia koloru jest bardzo trudne, a dla niedoświadczonego w tym konkretnym oprogramowaniu użytkownika praktycznie niewykonalne; możliwe jest jedynie stwierdzenie, który bąbelek ma bardziej wyrazistą barwę, a więc większą wartość którą reprezentuje nasycenie. Na szczęście i w tym przypadku w sukurs przychodzi nam interakcja Etykietki, umożliwiająca użytkownikowi odczytanie dokładnych danych.
Oprócz przedstawiania wielkości zjawiska przy pomocy rozmiaru bądź nasycenia, możemy także przedstawić jego strukturę, zamieniając bąbelki na małe wykresy kołowe. W tym celu musimy umieścić odpowiednią kolumnę w polu Legenda.
Uwaga: aby umieścić jakikolwiek element w obszarze Legenda, pole Nasycenie koloru musi być puste. Nie ma możliwości stworzenia wykresów kołowych o różnym nasyceniu koloru.
Obszar Etykietki jest ściśle powiązany z interakcją – po dodaniu dowolnej kolumny w te pole, informacje w niej zawarte będą pojawiały się w okienku pojawiającym się po skierowaniu kursora na wykres kołowy.
Mając zaznaczoną wizualizację danych w postaci mapy możemy przejść do zakładki Format na wstążce wizualizacje:
Bez wątpienia bogate możliwości edycji mapy są znacznym progresem w stosunku do map w Power View. Użytkownik ma możliwość:
– edycji legendy, włączając w to nie tylko zmianę jej położenia, ale także koloru, kroju i rozmiaru użytej czcionki;
– edycji koloru danych – istnieje możliwość zmiany każdego koloru osobno; w Power View mogliśmy jedynie wybierać odgórnie narzucone palety barw. Warto jednak pamiętać, iż z reguły domyślne kolory są już dobrane zgodnie z zasadami ich skutecznego użycia; wszelkie ich zmiany powinny być dobrze przemyślane.
– włączenia etykiet kategorii – w tym przypadku kategorie są rozumiane jako lokalizacja; ich włączenie powoduje wyświetlenie nazw lokacji.
– edycji rozmiaru bąbelków – jest do dostępne z poziomu rozwijanego menu Bąbelki:
– zmiany zachowania mapy w przypadku filtrowania – służy do tego chyba najmniej intuicyjne nazwane menu Kontrolki mapy:
W przypadku włączonej opcji Automatyczne powiększanie po przefiltrowaniu danych program powiększy mapę do obszaru w którym pozostały bąbelki. W przypadku wyłączenia tej opcji, program nie będzie automatycznie zmieniał widoczności mapy.
– zmiany stylu mapy – służy do tego menu Style mapy. Do wyboru mamy warianty dobrze nam znane z innych dodatków Excela: motyw mapy satelitarnej, ciemny, jasny, odcieni szarości oraz mapy drogowej.
– zmiany tytułu – nawet coś tak trywialnego jest bardzo istotną rzeczą; opcja ta daje nam możliwość nadania tytuły który będzie łatwiejszy do zrozumienia dla odbiorcy niż zwyczajne wyświetlanie nazw kolumn przy pomocy których dana wizualizacja została stworzona.
– zmiany koloru tła oraz obramowania;
– zablokowania proporcji mapy – w ten sposób projektant dashboardu może zabezpieczyć się przed zmianą kształtu danej wizualizacji przez użytkownika. Mając włączoną tą opcję, użytkownik może jedynie zmienić kształt mapy, a nie jej proporcje;
– zmiany pozycji mapy – oprócz przesuwania oraz zmiany kształtu przy pomocy myszki, istnieje możliwość wykonania tej operacji z poziomu menu Ogólne; należy pamiętać, że współrzędne podane w polach Położenie X, Położenie Y odnoszą się do lewego górnego punktu wizualizacji. W prawo rosną wartości współrzędnych X, a w dół współrzędnych Y. Nie jest to klasyczny matematyczny układ współrzędnych, ale układ wykorzystywany w programowaniu.
Kartogram w Power BI
Kolejnym sposobem prezentacji danych przy pomocy mapy jest kartogram. Najprościej rzecz ujmując, jest to przedstawienie wartości poprzez zabarwienie na określony kolor pewnego, określonego granicami, obszaru. Przy pomocy tego rodzaju wizualizacji powinno pokazywać się dane które mają charakter względny, tzn. są prezentowanie w odniesieniu do różnego rodzaju granic administracyjnych.
Tworzenie kartogramu jest identyczne jak tworzenie kartodiagramu ukrywającego się w Power BI pod ogólnym wyrazem Mapa – we wstążce wizualizacje znajdują się dokładnie te same pola.
Poniżej przykładowe użycie tego sposobu wizualizacji – mapa pokazująca gęstość zaludnienia w Polsce. Dane tabelaryczne zawierają liczbę osób przypadającą na jeden kilometr kwadratowy poszczególnych województw.
Na pierwszy rzut oka rzucają się pewnie niedogodności. Jedną z nich jest brak jest legendy ze skalą przypisującą wartości kolorom, w związku z czym na pierwszy rzut oka nie widzimy nie widzimy o jakiego rzędu wielkościach mówimy. W tej sytuacji pomaga niezawodna interakcja Etykietki – po najechaniu kursorem na dowolne województwo otrzymujemy informację o przypisanych mu wartościach. Mimo to, ciągła skala z przypisanym im wartościom – przynajmniej minimalna i maksymalną – jest czymś, co na pewno przydałoby się tej formie przedstawiania danych.
Kolejnym drobnym problemem jest widoczność poszczególnych obszarów na które podzielone jest mapa. W domyślnym ustawieniu – tzn. mapie w stylu drogowym i dość pastelowych kolorach skali – interpretacja kartogramu może okazać się odrobinę trudna, ponieważ powierzchnie na które podzielona jest mapa potrafią „zlewać” się ze sobą. Ponadto kompleksy leśne, widoczne na tym typie mapy, wpływają na kolor przedstawianych danych i wzmagają trudność odczytania mapy
Rozwiązaniem jest oczywiście ręczna modyfikacja poszczególnych parametrów – warto zmienić motyw mapy na ciemny, a kolory danych na odrobinę bardziej jaskrawe.
Oczywiście takie rozwiązanie ma także swoje wady – kolor czarny silnie przyciąga uwagę użytkownika. Umiejscowienie takiej mapy w dashboardzie spowoduje, że zostanie on przez nią całkowicie zdominowany. W rzeczywistości każda kompozycja wizualna kartogramu powinna zostać dobrana indywidualnie, w zależności od charakterystyki danych oraz dashboardu.
Oprócz tworzenia kartogramu przedstawiającego natężenie dowolnego zjawiska, mamy także możliwość stworzenia mapy podziału interesującego nasz obszary na mniejsze jednostki, np. mapa województw Polski. W tym celu umieszczamy w obszarze Legenda tą samą kolumnę co w obszarze Lokalizacja.
Możliwości zmiany kartogramu są takie same, jak w przypadku mapy – różnica polega na tym, że w kartogramie nie znajdziemy opcji związanych z przedstawianiem danych przy pomocy bąbelka, tzn. Etykiety kategorii oraz Bąbelki:
Lokalizacja
Niezależnie od sposobu prezentacji danych, w obszarze Lokalizacje we wstążce Wizualizacje umieszczamy kolumnę z naszej tabeli, która będzie określała odniesienie geograficzne naszych danych – mogą być to nazwy miast, województw, kody pocztowe i inne atrybuty określające położenie. Niestety, bardzo często zdarza się, iż na świecie istnieje więcej niż jedno miejsce o tej samej bądź bardzo zbliżonej nazwie. W takim przypadku może okazać się, że Power BI może błędnie wyświetlić dane.
Przykładowo, zamiast miejscowości Orły w województwie łódzkim program może wskazać podparyską miejscowość Orly:
Innym przykładem może także być miejscowość Linia – okazuje się bowiem, że nazwa ta nie jest jedynie nazwą miejscowości w Polsce, ale także w Czadzie:
Nie ma możliwości ręcznego zmienienia pozycji poszczególnych punktów – jedynym rozwiązaniem jest powiązanie poszczególnych miejsc z odpowiednimi współrzędnymi – o ile takimi dysponujemy. W przeciwnym przypadku pozostaje nam skorzystanie z różnych stron internetowych, np. https://www.doogal.co.uk/BatchGeocoding.php. Niestety, prawdopodobnie wszystkie darmowe witryny internetowe nadające współrzędne miejscom mają ograniczenia co do liczby przetwarzanych rekordów.
Niejednoznaczność może objawiać się także wskazywaniem nie tyle nieprawidłowych miejsc, co nieprawidłowych jednostek administracyjnych. Klasycznym przykładem są stany i miasta znajdujące się Stanach Zjednoczonych – znajdziemy tam miasto, stan oraz hrabstwo o nazwie Washington, które to znajdują się w zupełnie innych częściach kraju. Nowy Jork jest zarówno nazwą stanu, jak i miasta będącego jego stolicą. Nazwa „Georgia” może oznaczać stan, małe miasteczko w innym stanie, bądź też angielską nazwę Gruzji. Przykłady można mnożyć, pojawia się więc pytanie – czy istnieje możliwość uściślenia o jaką jednostkę nam chodzi?
Z pomocą przychodzi nam zakładka Modelowanie oraz obszar Właściwości. Staje się on aktywny po zaznaczeniu dowolnej kolumny we wstążce Pola.
Znajdują się w niej trzy pola, z których nasz interesuje środkowe – Kategoria danych. Mając zaznaczoną kolumnę z wykazem miejsc wybieramy jedną z pożądanych przez nas kategorii.
Trudno porównywać podział administracyjny poszczególnych krajów (np. Polski oraz Stanów Zjednoczonych) ze względu na znaczne różnice. W takich przypadkach warto wiedzieć, iż tłumacze postanowili przetłumaczyć jako województwa kategorię która w oryginale brzmiała State or Province.
Po załadowaniu tabeli w której znajdują się niejednoznaczne nazwy lokacji program zaproponuje jedno z rozwiązań, które zmieniamy poprzez omówione kategorie danych. Przykładowo, bo wczytaniu tabeli z nazwami Washington oraz Georgia program przypisze wartości do konkretnych stanów:
Definiując wartości opisujące lokalizację jako miasta zmieniamy mapę na poniższą:
Przy omawianiu geograficznych kategorii danych warto zauważyć, iż program bardzo dobrze radzi sobie z lokalizacją terenów przypisanych poszczególnym kodom pocztowym:
Wady i zalety Mapy oraz Kartogramu
Zalety
- automatyczne geokodowanie
- możliwość wgrania własnych współrzędnych (Mapa)
- wsparcie interakcji filtrowania, drążenia, grupowania
- dostępnych jest kilka podkładów mapowych
- dla Polski działają województwa i kody pocztowe (choć tu nie ma pewności, co do jakości mapy)
Wady
- nieprawidłowe skalowanie bąbelków
- ograniczona liczba kształtów i punktów wyświetlanych jednocześnie (wg moich szacunków 1000-1500)
- niewielkie możliwości sterowania kolorem w postaci bardziej rozbudowanych palet
- automatyczne geokodowanie może prowadzić do błędów
- brak możliwości śledzenia elementów niewyświetlonych
- brak wsparcia powiatów i gmin (tu proste rozwiązanie dla kartogramu to Mapa kształtów Power BI)
Masz swoje obserwacje nt. Mapy lub Kartogramu w Power BI?
Podziel się w komentarzu.
Bartek, czy istnieje sposób aby w bąbelkach pokazać wartości?
Hej Piotrek, trzeba by klikać prawym każdy bąbelek z osobna, aby pokazać etykietę.