Znanost o podacima je disciplina koja proučava odakle potječe određena baza podataka. Također se raspravlja o tome kako se ti resursi mogu tumačiti i predstavljati za produktivnu upotrebu.
Odnosno, znanost o podacima odnosi se na upravljanje bazama podataka, pohranjenim u digitalne datoteke, iz kojih se kao statistički pokazatelji mogu izvući mnoge korisne informacije. To može pomoći, na primjer, tvrtki u donošenju poslovnih odluka.
Slično tome, znanost o podacima pruža alate koji omogućuju ne samo tumačenje, već i prikazivanje, na primjer, na slikama dostupnih podataka. Dakle, među ostalim imamo histogram, trakasti dijagram, tortni dijagram.
Kao što se može zaključiti, ova je znanost interdisciplinarna jer obuhvaća uglavnom znanje iz matematike, statistike i informatike.
Znanost o podacima i tipovi podataka
Također treba napomenuti da znanost o podacima može raditi s dvije vrste podataka:
- Strukturirano: Oni su oni koji su organizirani, poput onih tablica s različitim stupcima, svaka s različitim kategorijama kao što su: ime, prezime, dob, broj osobnog dokumenta itd.
- Nestrukturiran: Oni koji ne odgovaraju određenom formatu, poput slobodno napisanog teksta. U tom slučaju morate protumačiti sadržaj i izvući podatke kojima se može upravljati.
Uzimajući u obzir sve što je objašnjeno, stručnjaci specijalizirani za znanost o podacima moraju ne samo imati analitičke vještine, već moraju biti sposobni prenijeti sadržaj podataka koje su obradili.
Važnost znanosti o podacima
Znanost podataka važna je za tvrtke ili institucije koje moraju raditi s velikom količinom podataka. Dakle, to može postati dragocjena informacija.
Znanost podataka možemo povezati s velikim podacima, koji se sastoje od razvoja mehanizama sposobnih za obradu i upravljanje masivnim podacima koji dolaze iz različitih izvora. Cilj je pretvoriti ih u informacije koje ljudsko biće može protumačiti i koje mu pomažu u donošenju odluka.
Ovi podaci za obradu mogu doći iz transakcija između pojedinaca i organizacija (kao što su bankarske operacije), svakodnevnih radnji ljudi (poput pretraživanja na Internetu), strojeva (poput GPS-a mobitela koji bilježi gdje je korisnik bio) ili podataka biometrijski (poput otiska prsta).
Povijest znanosti o podacima
Može se reći da je američki statističar John Wilder Tukey bio pionir znanosti o znanosti 1960-ih, ističući važnost analize podataka, a ne testiranja statističkih modela.
Međutim, tek se 1996. godine termin nauka o podacima prvi put koristi u naslovu predavanja, u predavanju pod nazivom: "Znanost o podacima, klasifikacija i srodne metode". To, u okviru sastanka članova ‘Međunarodne federacije klasifikacijskih društava’ (IFCS) održanog u Kobeu, Japan.
Sljedeća važna prekretnica postigla se 2005. kada je Nacionalni znanstveni odbor objavio "Dugovječne zbirke digitalnih podataka koje omogućavaju istraživanje i obrazovanje u 21. stoljeću". U tom su dokumentu znanstvenici podataka definirani kao računalni stručnjaci, programeri baza podataka i softvera te profesionalci iz drugih disciplina (poput knjižničara i arhivista), koji su presudni za uspješno upravljanje digitalnom zbirkom podataka.
Međutim, ovo je područje studija koje se još uvijek razvija.