Podaci – izveštavanje, odlučivanje

21. 04. 2017.07. 08. 2017. Nenad Veljković

Kako da učinimo informacioni sistem inteligentnijim a njegove odgovore na pitanja relevantnijim? Odgovor je u obradi veće količine podataka i boljoj interpretaciji dobijenih rezultata. Dobrodošli u big data avanturu!

Možete li da zamislite situaciju u kojoj, prilikom kreiranja predračuna, dobijete od svog poslovnog softvera poruku: „Da li ste sigurni kako želite da odobrite rok plaćanja od 45 dana? Statistika: u vašoj industrijskoj grani prosečan odobreni rok plaćanja je 30 dana, a realni rok naplate je 34,5 dana?“ ili „Da li ste sigurni da želite da odobrite popust od 10 posto? Prosečan popust na artikle u vašoj industrijskoj grani je 7,8%“. Zvuči nestvarno? Ovakve i slične poruke ne očekujemo od računarskog sistema, već od ljudi sa bogatim iskustvom, znanjem i osećajem. Ako malo bolje raščlanimo ove tri kategorije: iskustvo, znanje i osećaj, možemo u njima prepoznati podatke, informacije i algoritme. Idealna postavka za računare.

Trenutno je situacija na terenu takva da računare snabdevamo podacima, osnovne informacije izvlačimo iz tih podataka, a za algoritme i tumačenje informacija zaduženi su ljudi. Možemo li deo tog posla prebaciti na računare? Podaci mogu biti različiti, a o tome smo pisali u PC#227.Oni mogu biti strukturirani, kao što su finansijski i slični podaci u poslovnim programima i nestrukturirani, kao što su tekstualni, grafički, video i ostali podaci koji se najčešće ne nalaze u poslovnim programima. Iz tih i takvih podataka, pre svega strukturiranih, izvlače se informacije i na osnovu njih se donose poslovne odluke.

Veliki ili mali podaci? Kako za koga…

Danas se svake sekunde generiše 50.000 GB podataka. Poređenja radi, pre samo 10 godina to je bilo oko 100 GB svake sekunde, a pre 20 godina samo 100 GB dnevno. Koncept Big Data i veliki podaci mogu delovati zastrašujuće i obeshrabrujuće. Ipak, veliko za svakoga ima drugačije značenje. Uzimajući u obzir da je većina domaćih kompanija mikro i mala, termin veliko za njih ima potpuno drugačije značenje nego za najvećih 500 kompanija na svetu. Velike podatke treba posmatrati kroz odnos potreba za podacima i troškova prikupljanja, skladištenja i obrade.

Ako u obzir uzmemo poslovnu primenu, da ne bismo mnogo širili priču, i fokusiramo se na strukturirane poslovne podatke, možemo zaključiti da ima velikih poslovnih podataka. To su podaci sadržani u finansijskim izveštajima koje kompanije jednom godišnje predaju (npr. Bilans stanja, Bilans uspeha…). Znamo gde se nalaze i do njih (ni)je teško doći. Ipak, čini se da je problem da se integrišu u dnevne poslovne aktivnosti, a pre svega u poslovno odlučivanje. Problem sa dostupnošću i integracijom nije lak i zahteva velika ulaganja u alate za prikupljanje, skladištenje, prečišćavanje, obradu i integraciju velikih podataka iz različitih izvora kako internih, tako i eksternih.

Prikupljanje podataka nije lako. Ako se za interne izvore nekako i snađu, kompanije imaju velikih problema da odrede relevantne izvore eksternih podataka. Skladištenje je manji, ali ne i trivijalan problem. Relacione baze podataka nisu više dovoljne. Potreban je drugačiji pristup skladištenju ogromnih količina podataka. Tu na scenu stupaju Hadoop, MongoDB i mnogi drugi alati. Zaustaviću se ovde da ne odem previše u tehničke detalje i alate. Oni postoje i ubrzano se razvijaju.

Primena Big Data vrlo je raznovrsna, naročito kada se ukrsti s konceptom Machine Learning, koji omogućava da naučimo mašine da „uče“. Zvuči naučnofantastično, ali u suštini to je pitanje statističke obrade velikih podataka i prepoznavanje obrazaca. Oblasti primene veoma su široke. Organizacije primenom koncepta velikih podataka imaju prilike da optimizuju svoje zalihe, da rade složene analize navika i ponašanja svojih postojećih i potencijalnih kupaca pa sve do detekcije prevara identifikujući rizične obrasce, prediktivne analitike i analize rizika. Šta će nam mašine reći i kako ćemo iskoristiti te informacije, pitanje je za neki drugi tekst.

Otvoreni podaci

Da bi sve ovo (i još mnogo toga) bilo uopšte moguće, potrebni su i otvoreni podaci. Evropska komisija u svojoj publikaciji Creating Value through OpenData definiše otvorene podatke, naglašava značaj otvaranja podataka koji su u vlasništvu državnih organa, zatim značaj kreiranja politika i polisa otvaranja i pristupa otvorenim podacima, kao i uticaj otvaranja podataka na izjednačavanje tržišne utakmice.

Ono što je važno izdvojiti iz ove publikacije jeste dosta precizno navođenje načina objavljivanja i pristupa otvorenim podacima. Tu se jasno kaže da pored toga što podaci mogu biti otvoreni, oni moraju biti dostupni svim zainteresovanim stranama na način koji je pogodan za dalju digitalnu obradu, a ne samo javno dostupni. To je ključ praktične upotrebe otvorenih (i velikih i malih) podataka.

Domaći teren i podaci

Vratimo se u lokalnu sredinu. Da bi scenario iz uvoda bio moguć, potrebno je postaviti nekoliko ključnih pitanja. Ima li velikih podataka? Gde se oni nalaze? Kako do njih doći? Kako ih integrisati u dnevne poslovne aktivnosti? Kako pomoću tih i takvih podataka unaprediti poslovno odlučivanje, a koje odluke se mogu automatizovati? I kako to sve da radi?

Ono što je problem na domaćem terenu jeste još uvek nedovoljno razvijena svest o poslovnom odlučivanju zasnovanom na podacima. Budimo realni, domaće tržište još uvek sazreva. Kvalitet podataka je diskutabilan, izvori podataka takođe. Vlasnici, direktori i menadžeri još se oslanjaju na iskustvo i osećaj. Da ne bude zabune, iskustvo i osećaj svakako su potrebni, ali oslanjanje samo na ova dva „parametra“ može biti varljivo. Na kraju, podaci omogućavaju da proverite svoj „osećaj“ prilikom odlučivanja. Možda se iznenadite.

Iskustvo i osećaj jesu bitni, ali određene stvari mogu da se zamene brojkama. Na primer, broj dana odloženog plaćanja za pojedine kupce. Možda se ne mora svaki put posezati za iskustvom i osećajem vlasnika ili direktora kada komercijalista treba da realizuje porudžbinu.

Primenom odlučivanja zasnovanog na podacima uspostavlja se sistem, a sistem znači da se uputstva i smernice za rad mogu napisati, predati novim zaposlenima i pratiti rezultati. Dodatno, sistem znači da nema nezamenljivih… I nije to samo pitanje velikih podataka i računarskog učenja, već i organizacionog učenja i upravljanja znanjem unutar organizacije. I kako to znanje prikupljati, dopunjavati, održavati, unapređivati i na kraju koristiti. Sve to zajedno pomaže bržem poslovnom odlučivanju i eliminaciji ili obilaženju nepotrebnih rizika u poslovanju preko potrebnih za održivo dugoročno poslovanje.

Kompanije, softveraši i računovođe

Dakle, podaci, informacije i analitika zajedno. Veliki podaci u zavisnosti od potreba kompanije. Izvori podataka, takođe. Ipak, postavlja se pitanje kako doći do tih velikih podataka prilikom analize poslovanja? Kada radite analizu poslovanja, kako da dobijete od svog poslovnog programa sledeći potencijalni savet: „Ako biste određenim kupcima odobrili popust na plaćanje pre roka dospeća (cassa sconto) u iznosu od 5%, likvidnost bi vam bila povećana 30% uz minimalni uticaj na profit u iznosu od 1%?“. Da li je to uopšte moguće?

Šta kada kompanija ima eksternog računovođu i eksternog dobavljača poslovnog softvera, kao što je to kod velikog broja kompanija na domaćem tržištu? Ko bi trebalo da „napuni“ softver podacima i informacijama kako bi gorepomenuti scenario mogao da se ostvari?

Kompanije već dosta toga mogu da izračunaju sa svojim internim podacima: obrt sredstava, zalihe, pokazatelje potraživanja, trajanje naplate, dane vezivanja zaliha, rok kreditiranja od strane dobavljača, profitabilnost, rentabilnost, likvidnost. I ne samo to, u zavisnosti od rešenja koje koriste, kompanije mogu dobiti i složenije ekonomske analize kao što su: Altman Z‑score, Chesser model, DuPont, Quicktest, Model Zmijewskog i slične. Svi ti indikatori mogu da pokažu zeleno, žuto ili crveno svetlo na osnovu kog se mogu preduzimati dalje akcije.

Pitanje je kako kompanije da dođu do spoljnih, industrijskih indikatora i kako te i takve indikatore da integrišu u svoja poslovna rešenja? Kako da znaju kontekst u kome posluju? Kako da kontekstu daju numeričke vrednosti? Šta je za moju kompaniju dobro, a šta može još bolje? I u odnosu na koga je to bolje? Kako da postavimo referentnu tačku u svom poslovanju, onu prema kojoj vrednujemo rezultate? I ko bi mogao da obezbedi te i takve podatke? Proizvođač softvera, računovođa ili neka treća strana?

Ako je to proizvođač poslovnog rešenja, on mora da ima neki način statističke obrade podataka svojih korisnika, a bez narušavanja privatnosti i sigurnosti tih podataka i, daleko bilo, gubljenja poverenja svojih korisnika. Ako je to računovođa, važi slično pitanje. Ako je to neka treća strana, primera radi, ponuđač poslovnih podataka, da li se takvi podaci mogu integrisati u poslovna rešenja? Ako bi to bilo moguće, onda bi i program, koristeći velike podatke, statistiku i algoritme, zaista pomagao u malim, svakodnevnim odlukama koje mogu imati uticaj na poslovanje kompanije. A to je prava moć. Sopstveni podaci možda više nisu dovoljni, vreme je za moć konteksta. Kada bih znao da svi u branši imaju marginu 10%, mogao bih da pitam zašto je margina moje kompanije 5%? Podaci otvaraju mogućnost za prepoznavanje obrazaca, da li imamo podatke i umemo li da ih prepoznamo?

Kao što su nekada alati poput točka i koplja predstavljali nadogradnju fizičkih ograničenja ljudi i pomogli da se ta ograničenja prevaziđu, danas su nam možda potrebni alati koji će pomoći da prevaziđemo mentalna ograničenja našeg uma? To su teme kojima bi se možda imalo smisla posvetiti u budućnosti. Osnovne stvari trebalo bi da smo već prevazišli. Automatsko knjiženje, periodično fakturisanje, generisanje PDV‑a i ostalih prijava, automatski obračun zarada i slično trebalo bi da su temelj koji je odavno postavljen. Ili je to možda previše optimistično razmišljanje?

Kurt Vonnegut i Big Data

Poznati pisac Kurt Vonnegut postavio je hipotezu o osnovnim grafičkim oblicima priča u književnosti. On je prezentovao ideju da priče prate emotivne krive te da mogu imati različite oblike i da su određeni oblici bolji za priče od drugih. Posle 20 godina, zahvaljujući podacima i tehnikama analize podataka, 2016. godine istraživač Andrew Reagan s grupom kolega potvrdio Vonnegutje‑ovu hipotezu identifikujući šest ključnih tipova emotivnih „krivih“ za priče. Osnov istraživanja bilo je 1.700 engleskih priča (knjiga) koje su više od 150 puta preuzete sa sajta Project Gutenberg. Dakle, Vonnegut je bio u pravu. Danas je pravo pitanje: kako možemo iskoristiti alate da potvrdimo ili opovrgnemo osećaje ili hipoteze koje imamo o svetu oko nas?

Naši veliki podaci

PC Press je ovog marta proslavio 22 godine postojanja. Za to vreme objavljeno je 242 broja, sa 130 strana u proseku i oko 500 reči po strani. To je više od 15 miliona napisanih, složenih i pročitanih reči. Za nas to jesu veliki podaci. Bilo bi zanimljivo istražiti koju priču pričaju PC Press podaci? Kakvu emotivnu krivu imaju PC Press „priče“?

Miodrag Ranisavljević

(Objavljeno u PC#242)

Facebook komentari: