Sažetak
Skladište podataka (SP) se u današnje vrijeme nalazi u iznimno dinamičnom poslovnom okruženju. S jedne strane imamo brojne (heterogene) izvore podataka koji su podložni čestim promjenama podataka i strukture, dok s druge strane imamo brojne promjene u informacijskim zahtjevima koje postavljaju poslovni korisnici. Problem koji se istražuje kod evolucije skladišta podataka jest pamćenje promjena opsega te strukture podataka i metapodataka, u dužem vremenskom periodu, kako bi SP što kvalitetnije moglo odgovoriti na korisničke zahtjeve za poslovnom analizom.
Cilj ovoga projekta je razviti model i prototip novog temporalnog sistemskog kataloga koji čuva sve metapodatke SP sustava (od izvora podataka, preko integriranog, centralnog SP pa do višedimenzionalnih područnih SP) te je podržan realnim skupom poslovnih scenarija (case study-ja), u svrhu efikasnijeg pamćenja promjena u podacima i njihovim shemama. Pritom u opseg istraživanja ulaze i strukturirani izvori podataka (npr. relacijske baze podataka) i nestrukturirani izvori podataka (npr. NoSQL baze podataka/web izvori podataka/big data).
Razvijeni model novog i temporaliziranog sistemskog kataloga bit će validiran formalno i empirijski, kroz: a) formalizaciju modela korištenjem načela teorije skupova, formalnu validaciju operacija evolucije nad modelom i formalnu definiciju pravila prevođenja i integracije shema i b) razvoj prototipa novog sistemskog kataloga te njegova validacija provedbom benchmark testova. Rezultati istraživanja služit će za definiranje novih metoda i pristupa u navedenim poljima, kao i za daljnju implementaciju rješenja u novu generaciju SP.
Tema istraživanja je iznimno aktualna te obuhvaća sve popularnija područja integracije – skladištenje podataka, poslovnu inteligenciju, podatke velikog obujma (eng. big data) te nestrukturirane izvore podataka. Upravo u tome vidimo doprinos ovoga istraživanja znanstvenom profiliranju Sveučilišta u Rijeci te Odjela za informatiku kao njegove sastavnice.