dr.sc. Goran Klepac - osobne stranice
Home
Data mining
REFII model
DM software i linkovi
Tekstovi
Vaša pitanja i odgovori
Konzultantske usluge RC
CV - dr. sc. Goran Klepac
CV - mr. sc. Leo Mršić
Ako je znanje moć, onda ga nećemo naći tamo gdje su svi. A ako je tamo, ono tada više neće biti nikakva moć.

Konrad Paul Liessmann
Vijesti Što je to data mining ?
12.07.2010.

Prijavite se na radionicu: "Inteligentno upravljanje portfeljem korisnika", koju će održati dr.sc. Goran Klepac, u organizaciji poduzeća "Comminus".


18.05.2010.

Sadržaj knjige: "Data Mining in Public and Private Sectors: Organizational and Government Applications".
Više o poglavlju u knjizi kojem je autor dr.sc. Goran Klepac: "Preparing for New Competition in the Retail Industry".


17.03.2010.

U izdanju poznate američke izdavačke kuće koja se bavi izdavanjem knjiga iz područja informacijskih znanosti (computer science) IGI global, krajem travnja 2010. izlazi knjiga: "Data Mining in Public and Private Sectors: Organizational and Government Applications", Antti Syvajarvi (Editor), Jari Stenvall (Editor), gdje je dr.sc. Goran Klepac jedan od koautora u knjizi.
Knjigu možete naručiti na www.amazon.com

06.09.2009.

Dr.sc. Goran Klepac će 11.09.2009. i 12.09.2009. održati predavanja na poslijediplomskom doktorskom studiju (FOI) iz predmeta Metode razvoja i istraživanje sustava poslovne inteligencije.


12.08.2009.

Na site je dodan tekst sa
praktičnim savjetim za razvoj ekspertnih sustava (PDF)

24.07.2009.

U zadnjem kvartalu 2009. godine izlazi knjiga na engleskom jeziku, radnog naslova: "Handbook of Research on Data Mining in Public and Private Sectors: Organizational and Government Applications", u izdanju izdavačke kuće
IGI global.
Jedan od koautora u knjizi je i dr.sc. Goran Klepac.


13.06.2009.

Na stranici DM software i linkovi (pod kategorijom "softver") možete pronaći novi link na softver za samoorganizirajuće mape, koji u demo verziji može biti koristan za razumijevanje ove vrste neuronskih mreža.
Uskoro će na ovome site-u biti objavljen tekst sa praktičnim savjetima za uspješan razvoj i implementaciju fuzzy ekspertnih sustava.

24.03.2009.

Na BI or not BI: Business survival kit seminaru (Zagreb, 25. ožujka 2009.), u organizaciji poduzeća CRMT, dr.sc. Goran Klepac održati će predavaje pod naslovom:" Inteligentno upravljanje portfeljem pomoću metoda data mininga".
Predavanje će se osvrnuti na ulogu metoda data mininga u svakodnevnom poslovanju, kao i promjenu karaktera metoda data mininga u uvjetima recesije. Na predavanju će biti prikazan ilustrativan primjer upravljanja trgovačkim portfeljem pomoću metoda data mininga u uvjetima recesije. Predavanje će posebnu pažnju posvetiti kreiranju sustava ranog upozorenja i sustava monitoriranja portfelja u službi potpore poslovnom odlučivanju.


09.03.2009.

Na 2. Međunarodnoj konferenciji o korporativnoj sigurnosti (Zagreb, 2. travnja 2009.) dr.sc. Goran Klepac će održati predavaje pod naslovom "Upravljanje portfeljem u uvjetima krize".
Predavanje će se osvrnuti na vrste portfelja s obzirom na različite grane gospodarstva te njihove specifičnosti u upravljanju s obzirom na tržišne uvjete poput recesije i konkurentske tržišne utakmice.
Predavanje će dati odgovor na pitanje što karakterizira upravljanje portfeljem u uvjetima krize, i kako nam u tome mogu pomoći metode data mininga.
Prezentirat će se metodologija primjene scenario analiza pomoću metoda data mininga, koja bi trebala biti podrška strateškom poslovnom odlučivanju.
Prikazat će se metodologija segmentacije pomoću tehnika data mininga prema kriteriju rizičnosti, i objasniti porast njenog značaja u uvjetima tržišne krize.
Na predavanju će također biti prikazan model cjelovitog sustava koji se temelji na tehnikama data mininga a koji služi kao potpora poslovnom odlučivanju u uvjetima tržišne krize.


27.02.2009.

U časopisu Financijska teorija i praksa br. 4/2008 objavljen je rad dr.sc. Gorana Klepca: Model osjetljivosti portfelja za analizu kreditnog rizika uzrokovanog strukturnim i makroekonomskim promjenama.

20.12.2008.



Objavljena je knjiga : "Credit Scoring - Concepts, Perspectives and Models"; editors: Ravi Kumar, Jain B; The Icfai University Press, India, 2008, ISBN: 978-81-314-1577-1. Klepac Goran je autor jednog poglavlja u knjizi.
Knjigu "Credit Scoring - Concepts, Perspectives and Models" možete naručiti ovdje.

03.10.2008.

10.09. - 12. 09. i od 01.10.-03.10.2008. dr. sc. Goran Klepac održao je seminare "Primjena data mining metoda u bankarstvu za analitičare" u organizaciji RBA.


08.09.2008.

Na predstojećoj 13. HrOUG konferenciji mr.sc. Leo Mršić održat će predavanje na temu tehničkog rješenja programa vjernosti Lantea Grupe: PremiumClub. Raspored svih događanja pogledajte ovdje.

28.08.2008.

dr.sc. Goran Klepac je jedan od predavača a mr.sc. Leo Mršić suradnik na kolegiju "Sustavi potpore odlučivanju ", u Visokoj školi za računarstvo.

12.07.2008.

Na predstojećoj Oracle Open World (OOW) konferenciji u San Franciscu, SAD od 21. do 25.09.2008. mr.sc. Leo Mršić održat će predavanje na temu projekta PremiumClub Lantea Grupe. Više o OOW konferenciji na stranicama konferencije. Detalji predavanja na ovoj adresi. Pregledajte sve prijavljene radove na ovoj adresi.

10.07.2008.

Pogledajte članak iz časopisa Info.ba vezano uz Oracle event u Sarajevu na kojem su sudjelovali dr.sc. Goran Klepac i mr.sc. Leo Mršić [članak, PDF, 200kb]

22.06.2008.

Dr.sc. Goran Klepac će 28.06.2008. održati predavanje na poslijediplomskom doktorskom studiju "Informacijske znanosti" na Fakultetu organizacije i informatike u okviru nositeljstva predmeta "Metode razvoja i istraživanje sustava poslovne inteligencije".

16.06.2008.

12. i 13. lipnja 2008. dr. sc. Goran Klepac održao je seminar "Primjena data mining metoda u bankarstvu" u organizaciji RBA.

Nove tekstove iz područja data mininga možete pronaći ovdje.


09.06.2008.

Goran Klepac i Leo Mršić su 04.06.2008. u organizaciji Oracle BIH, održali seminar u Sarajevu.
Seminar je prikazao problematiku primjene poslovne inteligencije u svakodnevnom poslovanju s managerske perspektive.

04.04.2007.

Pogledajte recenziju knjige "Poslovna inteligencija kroz poslovne slučajeve" (Vip poslovni magazin, 04.04.2007.)

04.01.2007.

Pogledajte recenziju knjige "Poslovna inteligencija kroz poslovne slučajeve" (Lider, 29.12.2006.)

06.12.2006.

Rezultate ankete (12 polaznika) uspješno završenog seminara u okviru DSA možete vidjeti ovdje.

Vi se također možete prijaviti na naredni seminar.



Želio/željela bih saznati nešto više o:

Churn modelima (analiza prekida ugovorih odnosa) (55,36%)

Fraud detection modelima (detekcije prijevara) (10,71%)

Segmentacijskim modelima (14,88%)

Scoring modelima (16,67%)

Ostalo (2,38%)


Ukupno glasova: 168
Rudarenje podataka (eng. data mining) bismo mogli definirati kao pronalaženje zakonitosti u podacima. Ti podaci mogu biti organizirani u baze podataka, ali isto tako to mogu biti i tekstualni podaci, nestrukturirani podaci proizašli iz Web-a, ili pak podaci organizirane u vremenske serije.
Zakonitosti pronalazimo primjenom metoda koje svoje korijene vuku iz različitih područja kao što su primjerice statistika, matematika, baze podataka, teorija informacija, teorija vjerojatnosti i umjetna inteligencija. Ovo je vrlo mlado područje, te postoji niz metodoloških pristupa problematici, kao i preferencije primjena metoda koje naginju ka određenom području ovisno o autorima koji obrađuju tu problematiku.
Preferencija metoda uglavnom ovisi i o području primjene, tako primjerice analize temeljene na rudarenju podacima koje se primjenjuju u kriminalistici i telekomunikacijama više naginju ka korištenju "link analiza" za razliku od nekih drugih područja primjene

Isto tako ne treba zanemariti vrlo živu trenutnu znanstvenu aktivnost na ovom podrucju, te produkciju čitavog niza novih metoda od kojih će se neke u budućnosti zasigurno popularizirati kao standardne metode rudarenja podataka.

Sa jedne strane istraživanja u ovom području usmjerena su ka traženju metoda za rješavanje specificnih problema, a sa druge strane kao rezultati istraživanja nude se nova metodološka rješenja poboljšanja postojećih metoda.

Interesantno je to što su u velikom broju slučajeva neiscrpni izvor inspiracije za znanstvena istraživanja u ovom području radovi matematičara iz ranijih razdoblja, od 16. stoljeća nadalje. Ti radovi uglavnom su se bazirali na procesiranju velikog broja podataka da bi se došlo do rješenja. Takva rješenja su prezentirana na deklarativnoj razini kao ideja, te se nije ulazilo u dublju razradu ideje zbog fizičke nemogućnosti procesuiranja velike količine podataka u ranijim razdobljima.
Fokus interesa tadašnjih znanstvenika je bio upravo izbjegavanje procesiranja velike količine podataka, te pronalaženje elegantnijih metoda kojima bi se izbjegla takva vrsta aktivnosti.

Pojedine metode koje se deklariraju kao metode rudarenja podataka razvijene su u svojim rudimentarnim oblicima u još u sedamdesetim i osamdesetim godinama dvadesetog stoljeća.
Tek je polovica devedesetih godina dvadesetog stoljeća donijela sintagmu rudarenje podataka (eng. data mining) koja objedinjava skup metoda i postupaka koje za cilj imaju otkrivanje zakonitosti u masi podataka.

S obzirom na interdisciplinarnost ovog područja vrlo je teško povuci jasnu granicu i deklarirati pojedine metode kao isključive metode rudarenja podataka.
Vrlo velik broj korištenih metoda nedvojbeno pripadaju u područje statistike poput primjerice metoda uzorkovanja, ali u lancu rudarenja podataka mogu biti vrlo značajna karika prilikom analize podataka.
To nikako nije nedostatak ovog podrucja vec prednost, posebice ako iz niza disciplina izaberemo one metode i postupke koje nas mogu dovesti do cilja u procesu analize.

Usprkos svemu tome, ipak možemo govoriti o opčeprihvaćenom skupu metoda koje se u stručnoj literaturi deklariraju kao metode rudarenja podataka.

Kao što je vec spomenuto izvori podataka mogu biti klasične tradicionalne baze podataka te primjena metoda rudarenja podataka nad tako formatiranim podacima spada u područje tradicionalnog rudarenja podataka. U novije vrijeme izdvajaju se podpodručja s obzirom na izvore podataka kao što je to rudarenje Weba, rudarenje teksta, te analiza vremenskih serija.
Osnovni razlog izdvajanja ovih područja proizlazi iz cinjenice što podaci nisu strukturirani u relacijske tablice, već su nestrukturirani, ili pak strukturirani na temelju specificnog formata.

Bez obzira na izvore podataka neizbježan proces u metodici otkrivanja znanja je čišćenje podataka. U ovoj etapi cilj je profiltrirati podatke od nečistoća. Pri tome moramo voditi racuna o analize eventualnih ekstremnih vrijednosti (eng. outliers), koji ponekad nisu šum u podacima, vec vrlo vrijedan podatak koji može biti presudan u otkrivanju zakonitosti.

Ako govorimo o sustavima poslovne inteligencije tada rudarenje podataka može biti podržano skladištima podataka. U praksi se često puta pojavljuje slučaj nepostojanja skladišta podataka, tako da se nakon čišćenja podataka direktno ulazi u proces pretprocesiranja podataka bez posredovanja skladišta podataka.
Korištenje skladišta podataka u procesima rudarenja podataka svodi se na korištenje dimenzija u kockama koje se mogu iskoristiti sa ciljem pretprocesiranja podataka koji nakon toga ulaze u analitičke metode rudarenja podataka.
Rudarenje podataka producira modele i otkriveno znanje, te ono ulazi u proces testiranja pouzdanosti. U slučaju nezadovoljavajućih rezultata, ponovo se ulazi u iterativni proces obrade, što odgovara spiralom pristupu razvoju sustava i modela rudarenja podataka.
Ako skladištenje podataka promatramo kroz prizmu rudarenja podataka, tada je jedna od glavnih značajki i prednosti korištenja skladišta podataka prilikom rudarenja podataka ušteda vremena. Naime skladišta podataka mogu u vrlo kratkom roku selektirati određene skupine podataka, koje su več pročišćene, tako da analitičar štedi vrijeme u tom segmentu ako se oslanja na skladišta podataka.
Iako ovakav sustav štedi vrijeme, u praksi se često puta ukazuje potreba za direktnim pristupom izvornim podacima zbog specifičnosti obrada.

Područja gdje se rudarenje podataka može uspješno primjenjivati su primjerice ekonomija, mehanika, medicina, genetika, mikrobiologija, , farmaceutika, ekonomija, telematika .

Generalno gledajući rudarenje podataka je primjenjivo u svim onim podrucjima gdje raspolažemo sa velikom masom podataka iz domene tog područja i na osnovu tih podataka želimo otkriti odredene pravilnosti, veze i zakonitosti.
Tako primjerice kod istraživanja djelovanja novog lijeka, na osnovu prikupljenih podataka možemo otkrivati koji su to kritični faktori, odnosno koje su karakteristike ljudi kod kojih je taj lijek djelovao, a koje su karakteristike ljudi kod kojih taj lijek nije izazvao željeni ucinak. Naravno, da bi takve vrste analiza bile uspješne potrebno je stvoriti kritičnu masu obilježja nad kojima se provodi analiza. Tako primjerice u skladu sa spomenutim primjerom vrlo značajan faktor djelotvornosti lijeka može biti uvjetovan dobi, ili pak preboljelost neke bolesti u prošlosti.
S obzirom na to da postoji čitav niz faktora koji mogu utjecati na ishod nekog događaja, zadatak rudarenja podataka je otkriti najznačajnije faktore i njihove karakteristike s obzirom na ciljana stanja. Ukratko, bez obzira na područje primjene, dobro iskorištene metode rudarenja podataka sposobne su otkriti zakonitosti iz velike mase podataka, pri čemu područje primjene dolazi u drugi plan. Ekspert iz domicilnog područja uz pomoc analitičara tumači i interpretira otkrivene zakonitosti.
Snaga primjene metoda rudarenja podataka takoder proizlazi iz činjenice što je rudarenje podataka neovisno o području primjene, jer se naglasak stavlja na podatke a ne na podrucje provodenja analiza.

Iz knjige "Poslovna inteligencija "

(c) 2006 | dr.sc. Goran Klepac | tehnička realizacija: mr.sc. Leo Mršić