Srpsko more otvorenih podataka
Portal otvorenih podataka Republike Srbije obezbeđuje pristup zanimljivim statistikama, od kojih se značajan deo redovno ažurira. Da vidimo kako se od tih podataka, primenom Power BI, kreiraju korisni izveštaji.
Koncept otvorenih podataka nije nov mada se u poslednje vreme o njemu malo više priča. Njegovi promoteri zalažu se za to da podaci treba da budu javno dobro, besplatno na raspolaganju svakome ko želi da ih obrađuje i na osnovu njih kreira izveštaje, bez pozivanja na autorska prava, cenzure ili druge mehanizme kontrole. Iz dana u dan na Internetu možete da pronađete sve više statističkih podataka, ali pristup većini baza se plaća. Kada je reč o otvorenim podacima, javne institucije (data.gov, data.gov.uk, data.europa.eu) ponudiće vam mnoštvo izveštaja, pa čak i pristup skupovima podataka, ali oni su često neupotrebljivi jer je potrebno puno rada na njihovom „prečišćavanju“ da biste ih doveli do upotrebljive forme.
U poređenju s nekim institucijama koje su počele da objavljuju otvorene podatke daleko pre nas, Portal otvorenih podataka Republike Srbije svetao je primer gde možete da pronađete mnoštvo zanimljivih statistika, od kojih se značajan deo redovno ažurira. I, što je najvažnije, često su nam na raspolaganju podaci koje ne morate mnogo da obrađujete pre nego što ih upotrebite. U tekstu koji sledi biće reči o tome šta sve korisno može tamo da se pronađe, kao i kako da konkretne podatke upotrebite uz pomoć Power BI izveštajne platforme i od njih napravite smislene izveštaje.
Pažljivo vozite!
Vožnja u glavnom gradu često se pretvori u avanturu, što zbog neverovatnih gužvi što zbog neoprezne vožnje pojedinih učesnika u saobraćaju. Imamo utisak da neki od nas, kada sednu ispred volana, tamo ispoljavaju sve svoje životne frustracije. Ovo za posledicu ima materijalnu štetu, a ponekad povrede ili tragičan ishod. O značaju ispravnosti vozila i pridržavanju propisa neprestano se govori u medijima, a puno nas nije svesno posledica. Uverite se i sami, preuzmite izveštaje MUP‑a i analizirajte podatke o saobraćajnim nesrećama u Beogradu i bližoj okolini.
Podaci se preuzimaju u ODT (Open Office) formatu, a datoteku najpre treba da otvorite i snimite kao Excel ili CSV dokument. U zavisnosti od opcije koju ste izabrali, pokrenite Power BI, a zatim u meniju Get Data izaberite opciju From Excel ili From Text/CSV.
Nakon uvoza datoteke otvorite Editor i samo dodelite željene nazive kolonama s podacima. Izaberite visual koji prikazuje mape, pa u polja Latitude i Longitude prevucite dimenzije koje opisuju geografsku širinu i dužinu, a u polje Legend dimenziju koja opisuje ishod saobraćajne nesreće. Zumiranjem mape biće prikazane statistike za željeni deo grada. Dalje možemo da dodamo datum i nekoliko klasifikacija kao interaktivne filtere (slajsere) i, kao što vidite, u samo nekoliko koraka došli ste do zanimljivog i prilično zabrinjavajućeg izveštaja.
Nastavnici informatike su na ceni
Portal sadrži i skupove podataka u vezi s prosvetom. Ovi izveštaji najčešće su na ćirilici. Power BI nema problema s prepoznavanjem ćiriličnog pisma, ali podaci treba da budu sačuvani u novijem Excel formatu, u strukturiranim tabelama. U tom slučaju uvoz protiče glatko, a ako se odlučite za neki drugačiji izvor, možda će biti potrebno da podatke uredite pre nego što ih uvezete u Power BI. Kada se radi o geografskim odrednicama, važi univerzalno pravilo da je za lokaciju potrebno kreirati izračunatu kolonu koja se sastoji iz naziva mesta i odrednice „SERBIA“, kako bi Bing mape prepoznale gde se mesta tačno nalaze. Nije nikakav problem ako su nazivi mesta na ćirilici.
Preuzeli smo Excel dokument s registrom slobodnih radnih mesta. Na osnovu njega možemo lako da kreiramo mapu, gde u polje Locations prevlačimo izračunatu kolonu koja predstavlja kombinaciju mesta i naziva „SERBIA“. Dodali smo nekoliko slajsera, kao i još jedan izveštaj na kome su u kolonama prikazani oni gradovi gde postoji više od tri slobodna radna mesta.
Ako filtere podesimo tako da prikazuju angažovanje nastavnika informatike i računarstva, videćemo kakve su bile potrebe za ovim kadrovima krajem prošle godine. Podaci su iz oktobra 2017, verujemo da će se ovih dana na portalu pojaviti neki malo ažurniji.
Ekologija
Ekolozi su štreberi, hvala Bogu, pa od institucija koje se neposredno ili posredno bave zaštitom životne sredine imamo mnoštvo korisnih podataka. Izvori obuhvataju statistike u vezi sa zagađenjem vazduha, zasićenošću vazduha polenom, kvalitetom vode i slično. Iako su kvalitetni, nisu preterano ažurni.
Preuzeli smo izveštaj o kvalitetu voda u 2016. godini koji se nudi u CSV formatu, a pokretanjem opcije Get Data, pa Text/CSV skup podataka se uvozi u Power BI. Ponovo, na jednostavan način, prevlačenjem visual‑a i izborom željenih dimenzija dobijamo izveštaje. U ovom slučaju napravili smo dva grafikona koji prikazuju vodostaj i zasićenost vode kiseonikom. Na raspolaganju nam je još mnoštvo drugih parametara koji mogu da se iskoriste za praćenje fizičke i hemijske ispravnosti uzorkovane vode.
Crimson Permanent Assurance
Ako vam se, nakon čitanja ovih redova, u mislima pojavila slika staraca zaposlenih u preduzeću Crimson Permanent Assurance, knjigovođa u penziji koji „gusare“, napadaju korporacije i menjaju im bilanse, onda ste verovatno idealan kandidat za kopanje po podacima (za neupućene: pogledajte film Monty Python’s The Meaning of Life). Inicijativa za objavljivanje otvorenih podataka postoji, ali kako u svetu, tako i kod nas, neki će vam podatke dati u prikladnoj formi, pa možete da ih iskoristite bez većeg „prečišćavanja“. Većina će to učiniti zato jer im je to nametnuta obaveza. U tom slučaju spremite se za naporan rad, a prethodno naučite Power Query i pazite da ne padnete sa ivice sveta!
Autor: Slavko Vujnović