Srpsko mo­re o­tvo­re­nih po­da­taka

Portal otvorenih podataka Republike Srbije obezbeđuje pristup zanimljivim statistikama, od kojih se značajan deo redovno ažurira. Da vidimo kako se od tih podataka, primenom Power BI, kreiraju korisni izveštaji.

Kon­cept o­tvo­re­nih po­da­ta­ka ni­je nov ma­da se u po­sle­dnje vre­me o nje­mu ma­lo vi­še priča. Nje­go­vi pro­mo­te­ri za­la­žu se za to da po­da­ci tre­ba da bu­du jav­no do­bro, bes­pla­tno na ras­po­la­ga­nju sva­ko­me ko že­li da ih o­brađuje i na o­sno­vu njih kre­ira i­zve­šta­je, bez po­zi­va­nja na autor­ska pra­va, cen­zu­re ili dru­ge me­ha­ni­zme kon­tro­le. Iz da­na u dan na In­ter­ne­tu mo­že­te da pro­nađete sve vi­še sta­tis­tičkih po­da­ta­ka, ali pris­tup većini ba­za se plaća. Ka­da je reč o o­tvo­re­nim po­da­ci­ma, jav­ne in­sti­tu­ci­je (data.gov, data.gov.uk, data.europa.eu) po­nu­diće vam mno­štvo i­zve­šta­ja, pa čak i pristup sku­po­vi­ma po­da­ta­ka, ali oni su čes­to ne­upo­tre­blji­vi jer je po­tre­bno pu­no ra­da na nji­ho­vom „prečišćava­nju“ da bis­te ih do­ve­li do upo­tre­blji­ve for­me.

U po­ređenju s ne­kim in­sti­tu­ci­ja­ma ko­je su počele da o­bjav­lju­ju o­tvo­re­ne po­dat­ke da­le­ko pre nas, Por­tal o­tvo­re­nih po­da­ta­ka Re­pu­bli­ke Srbi­je sve­tao je pri­mer gde mo­že­te da pro­nađete mno­štvo za­nim­lji­vih sta­tis­ti­ka, od ko­jih se značajan deo re­dov­no ažu­ri­ra. I, što je naj­va­žni­je, čes­to su nam na ras­po­la­ga­nju po­da­ci ko­je ne mo­ra­te mno­go da o­brađuje­te pre ne­go što ih upo­tre­bi­te. U tek­stu ko­ji sle­di biće reči o to­me šta sve ko­ri­sno mo­že ta­mo da se pro­nađe, kao i ka­ko da kon­kre­tne po­dat­ke upo­tre­bi­te uz po­moć Power BI i­zve­štaj­ne plat­for­me i od njih na­pra­vi­te smi­sle­ne izve­šta­je.

Pročitajte i:  Intervju: Delta u Holdingu podataka

Pa­žlji­vo vo­zi­te!

Vo­žnja u glav­nom gra­du čes­to se pre­tvo­ri u avan­tu­ru, što zbog ne­ve­ro­va­tnih gu­žvi što zbog ne­o­pre­zne vo­žnje po­je­di­nih uče­sni­ka u sa­o­braćaju. Ima­mo uti­sak da ne­ki od nas, ka­da se­dnu is­pred vo­la­na, ta­mo is­po­lja­va­ju sve svo­je životne frus­tra­ci­je. Ovo za po­sle­di­cu ima ma­te­ri­jal­nu šte­tu, a po­ne­kad pov­re­de ili tra­gičan is­hod. O značaju is­prav­nos­ti vo­zi­la i pri­drža­va­nju pro­pi­sa ne­pres­ta­no se go­vo­ri u me­di­ji­ma, a pu­no nas ni­je sve­sno po­sle­di­ca. Uve­ri­te se i sa­mi, pre­u­zmi­te i­zve­šta­je MUP‑a i ana­li­zi­raj­te po­dat­ke o sa­o­braćaj­nim ne­srećama u Be­o­gra­du i bli­žoj oko­li­ni.

Po­da­ci se pre­uzi­ma­ju u ODT (Open Office) for­ma­tu, a da­to­te­ku naj­pre tre­ba da o­tvo­ri­te i sni­mi­te kao Excel ili CSV do­ku­ment. U za­vi­snos­ti od op­ci­je ko­ju ste iza­bra­li, po­kre­ni­te Power BI, a za­tim u me­ni­ju Get Data iza­be­ri­te op­ci­ju From Excel ili From Text/CSV.

Na­kon uvo­za da­to­te­ke o­tvo­ri­te Editor i sa­mo do­de­li­te že­lje­ne na­zi­ve ko­lo­na­ma s po­da­ci­ma. Iza­be­ri­te visual ko­ji pri­ka­zu­je ma­pe, pa u po­lja Latitude i Longitude pre­vu­ci­te di­men­zi­je ko­je opi­su­ju ge­o­gra­fsku ši­ri­nu i du­ži­nu, a u po­lje Legend di­men­zi­ju ko­ja opi­su­je is­hod sa­o­braćaj­ne ne­sreće. Zu­mi­ra­njem ma­pe biće pri­ka­za­ne sta­tis­ti­ke za že­lje­ni deo gra­da. Da­lje mo­že­mo da do­da­mo da­tum i ne­ko­li­ko kla­si­fi­ka­ci­ja kao in­te­rak­tiv­ne fil­te­re (slaj­se­re) i, kao što vi­di­te, u sa­mo ne­ko­li­ko ko­ra­ka do­šli ste do za­nim­lji­vog i pri­lično za­bri­nja­va­jućeg i­zve­šta­ja.

Nas­tav­ni­ci in­for­ma­ti­ke su na ceni

Por­tal sa­drži i sku­po­ve po­da­ta­ka u ve­zi s pro­sve­tom. Ovi i­zve­šta­ji najčešće su na ćiri­li­ci. Power BI ne­ma pro­ble­ma s pre­po­zna­va­njem ćiri­ličnog pi­sma, ali po­da­ci tre­ba da bu­du sačuva­ni u no­vi­jem Excel for­ma­tu, u struk­tu­ri­ra­nim ta­be­la­ma. U tom slučaju uvoz pro­tiče glat­ko, a ako se o­dlučite za ne­ki dru­gačiji i­zvor, mo­žda će bi­ti po­tre­bno da po­dat­ke ure­di­te pre ne­go što ih uve­ze­te u Power BI. Ka­da se ra­di o ge­o­gra­fskim o­dre­dni­ca­ma, va­ži uni­ver­zal­no pra­vi­lo da je za lo­ka­ci­ju po­tre­bno kre­ira­ti i­zračuna­tu ko­lo­nu ko­ja se sas­to­ji iz na­zi­va mes­ta i o­dre­dni­ce „SER­BIA“, ka­ko bi Bing ma­pe pre­po­zna­le gde se mes­ta tačno na­la­ze. Ni­je ni­ka­kav pro­blem ako su na­zi­vi mes­ta na ćiri­li­ci.

Pročitajte i:  Disaster Recovery: Izbegnuta katastrofa najmanje boli

Pre­uze­li smo Excel do­ku­ment s re­gis­trom slo­bo­dnih ra­dnih mes­ta. Na o­sno­vu nje­ga mo­že­mo la­ko da kre­ira­mo ma­pu, gde u po­lje Locations prev­lačimo i­zračuna­tu ko­lo­nu ko­ja pred­stav­lja kom­bi­na­ci­ju mes­ta i na­zi­va „SER­BIA“. Do­da­li smo ne­ko­li­ko slaj­se­ra, kao i još je­dan i­zve­štaj na ko­me su u ko­lo­na­ma pri­ka­za­ni oni gra­do­vi gde pos­to­ji vi­še od tri slo­bo­dna ra­dna mes­ta.

Ako fil­te­re po­de­si­mo ta­ko da pri­ka­zu­ju an­ga­žo­va­nje nas­tav­ni­ka in­for­ma­ti­ke i računar­stva, vi­dećemo ka­kve su bi­le po­tre­be za ovim ka­dro­vi­ma kra­jem pro­šle go­di­ne. Po­da­ci su iz ok­to­bra 2017, ve­ru­je­mo da će se ovih da­na na por­ta­lu po­ja­vi­ti ne­ki ma­lo ažur­ni­ji.

 

Eko­lo­gija

Eko­lo­zi su štre­be­ri, hva­la Bo­gu, pa od in­sti­tu­ci­ja ko­je se ne­po­sre­dno ili po­sre­dno ba­ve za­šti­tom ži­vo­tne sre­di­ne ima­mo mno­štvo ko­ri­snih po­da­ta­ka. I­zvo­ri obu­hva­ta­ju sta­tis­ti­ke u ve­zi sa za­gađenjem va­zdu­ha, za­sićenošću va­zdu­ha po­le­nom, kva­li­te­tom vo­de i slično. Iako su kva­li­te­tni, ni­su pre­te­ra­no ažur­ni.

Pre­uze­li smo i­zve­štaj o kva­li­te­tu vo­da u 2016. go­di­ni ko­ji se nu­di u CSV for­ma­tu, a po­kre­ta­njem op­ci­je Get Data, pa Text/CSV skup po­da­ta­ka se uvo­zi u Power BI. Po­no­vo, na je­dnos­ta­van način, prev­lačenjem visual‑a i i­zbo­rom že­lje­nih di­men­zi­ja do­bi­ja­mo i­zve­šta­je. U ovom slučaju na­pra­vi­li smo dva gra­fi­ko­na ko­ji pri­ka­zu­ju vo­dos­taj i za­sićenost vo­de ki­se­oni­kom. Na ras­po­la­ga­nju nam je još mno­štvo dru­gih pa­ra­me­ta­ra ko­ji mo­gu da se is­ko­ris­te za praćenje fi­zičke i he­mij­ske is­prav­nos­ti uzor­ko­va­ne vo­de.

Pročitajte i:  Intervju: Delta u Holdingu podataka

Crim­son Per­ma­nent As­su­rance

Ako vam se, na­kon čita­nja ovih re­do­va, u mi­sli­ma po­ja­vi­la sli­ka sta­ra­ca za­po­sle­nih u pre­du­zeću Crimson Permanent Assurance, knji­go­vođa u pen­zi­ji ko­ji „gu­sa­re“, na­pa­da­ju kor­po­ra­ci­je i me­nja­ju im bi­lan­se, on­da ste ve­ro­va­tno ide­alan kan­di­dat za ko­pa­nje po po­da­ci­ma (za ne­upućene: po­gle­daj­te film Monty Python’s The Meaning of Life). Ini­ci­ja­ti­va za o­bjav­lji­va­nje o­tvo­re­nih po­da­ta­ka pos­to­ji, ali ka­ko u sve­tu, ta­ko i kod nas, ne­ki će vam po­dat­ke da­ti u pri­kla­dnoj for­mi, pa mo­že­te da ih is­ko­ris­ti­te bez većeg „prečišćava­nja“. Većina će to učini­ti za­to jer im je to na­me­tnu­ta oba­ve­za. U tom slučaju spre­mi­te se za na­po­ran rad, a pret­ho­dno naučite Power Query i pa­zi­te da ne pa­dne­te sa ivi­ce sve­ta!

Autor: Slavko Vujnović

Facebook komentari:

SBB

PC Press konkurs
Tagovi: ,