Beruflich Dokumente
Kultur Dokumente
Aktuelno
Big Data
u farmaciji
i medicini
BIG DATA ANALITIKA PREDSTAVLJA POJAM KOJI SE ODNOSI NA PRIMENU NAPREDNIH TEHNIKA ANALIZE VELIKIH KOLIINA PODATAKA IJE GENERISANJE SE SVE VIE UBRZAVA. SVOJU PRIMENU NALAZI
U MNOGIM OBLASTIMA POSLOVANJA, A NAROITO U OBLASTI MEDICINE. UKOLIKO SE PRAVILNO UPOTREBI, BIG DATA ANALITIKA MOE STVORITI USLOVE ZA IZGRADNJU ODRIVE KONKURENTSKE
PREDNOSTI NA TRITU, TO JE OD POSEBNOG ZNAAJA ZA FARMACEUTSKE KOMPANIJE.
Dve osnovne karakteristike savremenih uslova poslovanja u farmaciji su rastua dinaminost i rastua kompleksnost. Rastua dinaminost se ogleda u procesu stalnih promena u okruenju, koje su duboke,
sveobuhvatne i vrlo intenzivne, dok se rastua kompleksnost ogleda u rastu broja
elemenata koji utiu na poslovanje, kao i
rastu njihovih meusobnih veza. Jedan od
faktora koji doprinose rastuoj kompleksnosti poslovanja jeste i eksponencijalni
rast koliine dostupnih podataka, koji pre
svega predstavlja rezultat razvoja informacionih tehnologija i Interneta, odnosno hardverskih (kapaciteti za skladitenje i obradu podataka) i softverskih kapaciteta (razvoj novih aplikacija). Prema reima Erika
mita, predsednika kompanije Google,
od nastanka civilizacije do 2003. godine
kreirano je ukupno 5 egzabajta1 podataka,
to predstavlja koliinu podataka koja se da-
Prema podacima iz kompanije Cisco Systems, poetkom 2015. godine u svetu je
bilo preko 25 milijardi elektronskih ureaja koji se
mogu povezati na Internet,
to znai da je prosean broj
ureaja po oveku bio 3,5. To
otvara nesluene mogunosti povezivanja i generisanja
novih podataka.
nas kreira u roku od dva dana. Ovaj enormni rast dostupnih podataka karakteristian
je za skoro sve oblasti ivota i poslovanja,
od ishrane, sporta i razonode, preko trgo-
Inae, merne jedinice za kapacitete skladitenja podataka obuhvataju bajt (B), kilobajt (kB), megabajt (MB), gigabajt (GB), terabajt (TB), petabajt (PB), egzabajt (EB), zetabajt (ZB) i
jotabajt (YB). O kolikim veliinama je ovde re najbolje govori podatak da 1 egzabajt obuhvata 1 milijardu gigabajta, odnosno da je ukupna koliina podataka na Internetu na kraju 2013.
godine iznosila 4 zetabajta, odnosno 4 miliona egzabajta, odnosno da ljudski rod jo uvek nije dostigao iznos od 1 jotabajta skladitenih podataka na jednom mestu.
38
Parametar
Tradicionalna analitika
Obuhvat podataka
Izvori podataka
Vrste izvetaja
Ovu definiciju je dao Daglas Lani u okviru istraivanja koje je 2001. godine sproveo u ime kompanije META Group (danas Gartner Inc). Izvor: Laney, Douglas (2001), Application Delivery
Strategies 3D Data Management: Controlling Data Volume, Velocity and Variety, META Group
3
Ibrahim; Targio Hashem, Abaker; Yaqoob, Ibrar; Badrul Anuar, Nor; Mokhtar, Salimah; Gani, Abdullah; Ullah Khan, Samee (2015), The Rise of Big Data on Cloud Computing: Review and
Open Research Issues, Information Systems, Vol. 47, str. 98-115
39
POSLOVANJE
Aktuelno
Napredna analitika
Tradicionalna analitika
Tradicionalna analitika
Srednja
Visoka
Niska
vima dijagnostikovanja i deskripcije, sve vie ustupa mesto naprednoj analitici (Big Data Approach), koja je bazirana na analizi celokupnih podataka na bazi upotrebe savremenih informacionih tehnologija i naprednih metoda statistike obrade podataka, koja se vri u realnom vremenu
(Real-Time) sa ciljem predvianja buduih
dogaaja.
Moe se rei da je koncept poslovne
analitike ili poslovne inteligencije evoluirao u etiri faze. U prvoj fazi, koja se naziva fazom dijagnostike analitike (Diagnostic Analytics) akcenat je na dijagnostikovanju problema i pronalaenju naknadnih
naina za njihovo reavanje. U drugoj fazi, koja se naziva fazom deskriptivne
analitike (Descriptive Analytics) akcenat
je na dijagnostikovanju problema, ali i na
opisu uzroka i posledica nastalih problema, kao i iznalaenju naina za njihovo reavanje. U treoj fazi, koja se naziva fazom
prediktivne analitike (Predictive Analytics) akcenat je na predvianju buduih
problema na bazi prethodnih iskustava,
kao i na merama prevencije posledica. U
etvrtoj fazi, koja se naziva fazom preskriptivne analitike (Prescriptive Analytics)
akcenat je na kompleksnoj analizi ponaanja koje dovodi do nastanka buduih
problema, te stoga i na razvoju metoda i
pristupa koji utiu na eljeno ponaanje
ciljnih subjekata.
Prediktivna analitika (Predictive Analytics) inae predstavlja skup naprednih alata i tehnika koje se koriste u analizi velikih
Terabajti
Petabajti
Veliina podataka
40
inskog uenja.
Ono to je vano znati je da je glavni pokreta Big Data analitike vrednost podataka. Prema Piteru Sondergardu iz kompanije Gartner Research, informacija je nafta XXI veka, a analitika je parna maina budunosti. Kompanije sve vie prepoznaju
podatke kao resurs (Data as an Asset) koji im omoguava da primenjuju superiorne strategije i grade odrivu konkurentsku
prednost na bazi upravljanja informacijama. Zbog toga, dolazi do rapidnog rasta Big
Data trita u svetu. Prema podacima
McKinsey Global Institute, globalno Big Data trite raste po prosenoj stopi od 46%
godinje. Ovo trite je u 2011. godini vredelo 5,5 milijardi dolara, u 2012. godini 8,5
milijardi dolara, a u 2015. godini 25 milijardi dolara. Oekuje se da bi vrednost Big Data trita do 2020. godine mogla da iznosi preko 200 milijardi dolara.
Zetabajti
nike distribucije frekvencije, (6) tehnike korelacije, (7) tehnike nominalnog poreenja
i (8) tehnike geografskog ili geo-prostornog
poreenja. Kao rezultat primene ovih tehnika, rezultati analize velikih serija podataka se najee prikazuju u formi stubova (Bars), histograma (Histograms), dvodimenzionalnih i trodimenzionalnih takastih dijagrama (Scatterplots i 3D Scatterplots), mrenih dijagrama (Networks), grafikona tokova (Streamgraphs), mape grananja (Treemap), gantograma (Gantt
Charts), ali i u formi raznih infografika (Infographics), koji su sve popularniji u poslednje vreme.
e veoma kompleksni, te stoga zahtevaju primenu naprednih tehnika prezentovanja. Vizualizacija podataka omoguava
korisnicima brzo i lako razumevanje informacija i meusobnih uzrono-posledinih
veza. Vizualizacija podataka je i nauka i
umetnost. Nauka je zbog toga to je bazirana tzv. naunom procesu obrade informacija (Data Science Process), koji je baziran na prediktivnoj analitici i upotrebi naprednih informacionih i statistikih tehnika. Umetnost je zbog toga to je bazirana na kreativnosti i dizajnerskim sposobnostima analitiara koji konstantno iznalaze nove perceptivno prihvatljive naine za prezentovanje podataka. Obzirom da
je proces vizuelne percepcije povezan sa
modanim aktivnostima i karakteristikama linosti, vizualizacija podataka je usko
povezana sa psihologijom i neurologijom.
Prema Stivenu Fjuu, postoji osam tehnika vizualizacije kvantitativnih podataka
koje se koriste u prediktivnoj analitici. To
su: (1) tehnike vremenskih serija, (2) tehnike rangiranja, (3) tehnike uporeivanja
delova i celine, (4) tehnike devijacije, (5) tehBB-INFORMATOR / JUL 2015. / 242
41
POSLOVANJE
Aktuelno
Proizvodnja podataka
(Big Data Production)
Izvori podataka:
Audio fajlovi
Video fajlovi
Tekstualni fajlovi
Internet pretraivai
Internet sajtovi
Drutvene mree
Podaci o logovima
Telekomunikacije
POS terminali
Baze potroaa
Novane transakcije
Berzanske transakcije
Medicinska istraivanja
Medicinska dijagnostika
Fraud podaci
GPS podaci
Senzorski podaci
Seizmoloki podaci
Klimatski podaci itd.
Izvorni podaci
42
Procesuiranje podataka
(Big Data Processing)
Konzumiranje podataka
(Big Data Consumption)
Prikupljanje podataka
(Data Gathering)
Vizualizacija podataka
(Data Visualization)
Skladitenje podataka
(Data Warehousing)
Poslovna primena
Marketing
Iskopavanje podataka
(Data Mining)
Prodaja
Medicina
Procesuiranje podataka
(Data Processing)
Informatika
Telekomunikacije
Bezbednost
Bezbednost podataka
(Data Security)
Obraeni podaci
tehnologijama. S druge strane, to su tehnike, koje se odnose na kompleksne i napredne tehnike statistike i matematike
obrade podataka. Praktino, Big Data tehnologije predstavljaju simbiozu tehnologija (softvera) i tehnika (statistikih alata) i na tritu se pojavljuju u obliku zaokruenih softverskih reenja koja integriu ova dva parametra.
to se tie tehnika (statistiki alati),
najee se koriste tehnike napredne regresione analize, tehnike mainskog uenja
(Machine Learning), tehnike analize vremenskih serija (Time Series Analysis), tehnike genetikih algoritama (Genetic Algorithms), tehnike fuzije i integracije podataka (Data Fusion and Integration), NLP tehnike, razne ekonometrijske simulacije
(npr. Monte-Carlo simulacija) itd.
to se tie tehnologija (softvera), u ponudi postoji veliki broj softverskih reenja
za Big Data analitiku. Sva ta reenja se mogu grupisati u tri osnovne kategorije. Prva kategorija obuhvata Apache Hadoop
platformu, koja predstavlja Open-Source
reenje koje se najee koristi u Big Data
analitici i koje je uraeno na Java platformi u cilju procesuiranja velikih koliina podataka putem tehnologije kompjuterskih klastera. Druga kategorija obuhvata
Komercijalizovani podaci