Znanost o podacima - što je to, definicija i koncept

Znanost o podacima je disciplina koja proučava odakle potječe određena baza podataka. Također se raspravlja o tome kako se ti resursi mogu tumačiti i predstavljati za produktivnu upotrebu.

Odnosno, znanost o podacima odnosi se na upravljanje bazama podataka, pohranjenim u digitalne datoteke, iz kojih se kao statistički pokazatelji mogu izvući mnoge korisne informacije. To može pomoći, na primjer, tvrtki u donošenju poslovnih odluka.

Slično tome, znanost o podacima pruža alate koji omogućuju ne samo tumačenje, već i prikazivanje, na primjer, na slikama dostupnih podataka. Dakle, među ostalim imamo histogram, trakasti dijagram, tortni dijagram.

Kao što se može zaključiti, ova je znanost interdisciplinarna jer obuhvaća uglavnom znanje iz matematike, statistike i informatike.

Znanost o podacima i tipovi podataka

Također treba napomenuti da znanost o podacima može raditi s dvije vrste podataka:

  • Strukturirano: Oni su oni koji su organizirani, poput onih tablica s različitim stupcima, svaka s različitim kategorijama kao što su: ime, prezime, dob, broj osobnog dokumenta itd.
  • Nestrukturiran: Oni koji ne odgovaraju određenom formatu, poput slobodno napisanog teksta. U tom slučaju morate protumačiti sadržaj i izvući podatke kojima se može upravljati.

Uzimajući u obzir sve što je objašnjeno, stručnjaci specijalizirani za znanost o podacima moraju ne samo imati analitičke vještine, već moraju biti sposobni prenijeti sadržaj podataka koje su obradili.

Važnost znanosti o podacima

Znanost podataka važna je za tvrtke ili institucije koje moraju raditi s velikom količinom podataka. Dakle, to može postati dragocjena informacija.

Znanost podataka možemo povezati s velikim podacima, koji se sastoje od razvoja mehanizama sposobnih za obradu i upravljanje masivnim podacima koji dolaze iz različitih izvora. Cilj je pretvoriti ih u informacije koje ljudsko biće može protumačiti i koje mu pomažu u donošenju odluka.

Ovi podaci za obradu mogu doći iz transakcija između pojedinaca i organizacija (kao što su bankarske operacije), svakodnevnih radnji ljudi (poput pretraživanja na Internetu), strojeva (poput GPS-a mobitela koji bilježi gdje je korisnik bio) ili podataka biometrijski (poput otiska prsta).

Povijest znanosti o podacima

Može se reći da je američki statističar John Wilder Tukey bio pionir znanosti o znanosti 1960-ih, ističući važnost analize podataka, a ne testiranja statističkih modela.

Međutim, tek se 1996. godine termin nauka o podacima prvi put koristi u naslovu predavanja, u predavanju pod nazivom: "Znanost o podacima, klasifikacija i srodne metode". To, u okviru sastanka članova ‘Međunarodne federacije klasifikacijskih društava’ (IFCS) održanog u Kobeu, Japan.

Sljedeća važna prekretnica postigla se 2005. kada je Nacionalni znanstveni odbor objavio "Dugovječne zbirke digitalnih podataka koje omogućavaju istraživanje i obrazovanje u 21. stoljeću". U tom su dokumentu znanstvenici podataka definirani kao računalni stručnjaci, programeri baza podataka i softvera te profesionalci iz drugih disciplina (poput knjižničara i arhivista), koji su presudni za uspješno upravljanje digitalnom zbirkom podataka.

Međutim, ovo je područje studija koje se još uvijek razvija.