Data Mining - što je to, definicija i koncept

Iskopavanje podataka postupak je pretraživanja velikih baza podataka radi pronalaženja korisnih informacija koje se mogu koristiti za donošenje odluka. Također se koristi engleski izraz "data mining".

Može se shvatiti kao tehnologija i softver koji se koriste za pronalaženje obrazaca ponašanja unutar baze podataka. Temeljna osnova za to je da ti obrasci pomažu u donošenju odluka. Na primjer, to bi moglo pomoći tvrtkama da razumiju obrasce ponašanja svojih kupaca. Na takav način da bi olakšao uspostavljanje strategija za povećanje prodaje ili smanjenje troškova.

Prednosti pretraživanja podataka

Temeljna prednost ovog postupka analize podataka je velik broj poslovnih scenarija na koje se može primijeniti, kao primjer imamo:

  • Predviđanje: Prognoza prodaje tvrtke.
  • Vjerojatnost: Izbor najboljih klijenata za izravan kontakt telefonom ili e-poštom.
  • Analiza slijeda: Analiza proizvoda koje su kupci kupili i provjera međusobne povezanosti među njima.

Faze pretraživanja podataka

Unutar postupka rudarenja podataka možemo pronaći pet faza:

  • Cilj i prikupljanje podataka: Prvo je usredotočiti se na to kakvu vrstu informacija želimo dobiti. Zamislimo primjer da supermarket želi znati koje je doba dana tamo gdje je najviše posjetitelja. To bi bio cilj i informacije koje trgovina želi dobiti u ovom slučaju.
  • Obrada podataka i upravljanje njima: Jednom kad znamo podatke koje želimo prikupiti, stavljamo ih na posao. Ovo je možda najteža faza procesa. Pa, potreban je odabir reprezentativnog uzorka na kojem će se provesti analiza. Nakon odabira uzorka, mora se analizirati koja će se varijabla ili regresijski model provesti na uzorku.
  • Odabir modela: Usko je povezan s prethodnom fazom. Riječ je o stvaranju modela ili algoritma koji nam daje najbolji mogući rezultat. Da bi se to učinilo, mora se provesti iscrpna analiza varijabli koje će biti uključene u model. To postaje složen zadatak, jer će ovisiti o vrsti podataka koji se analiziraju. Stoga rudari podataka provode različita ispitivanja algoritma kao što su: linearna regresija, stablo odlučivanja, vremenske serije, neuronska mreža itd.
  • Analiza i pregled rezultata: U osnovi je analiza rezultata kako bi se vidjelo daju li logično objašnjenje. Objašnjenje koje olakšava donošenje odluka na temelju podataka danih u rezultatima.
  • Ažuriranje modela: Posljednji korak postupka bilo bi ažuriranje modela. Vrlo je važno da se to s vremenom učini kako ne bi zastarjelo. Varijable modela mogu postati beznačajne i stoga je potrebna periodična kontrola modela.

Popularni Postovi

Španjolske tvrtke: Sinonim poslovne izvrsnosti u svijetu

Ako prolazimo New Yorkom, moramo samo okrenuti pogled kako bismo shvatili visoku prisutnost španjolskih tvrtki koje preplavljuju njegove ulice. Tvrtke kao što su Porcelanosa, Santander Bank, Inditex postale su velike multinacionalke s prisutnošću u glavnim gradovima širom svijeta. Osim toga, visoka Pročitajte više…

Kako će nova europska uredba o zaštiti podataka utjecati na tvrtke?

Skandal oko kršenja privatnosti na Facebooku imao je ogroman utjecaj u cijelom svijetu. Već u našem članku "Slučaj Facebook odvlači cijeli tehnološki sektor u katastrofu" otkrili smo ključeve kako su privatni podaci pali u ruke konzultantske kuće Cambridge Analytica. Pa, slučajPročitajte više…

Profesionalci budućnosti: slobodni profesionalci

Posljednjih godina vidjeli smo kako je zapošljavanje doživjelo totalnu remetilačku promjenu na globalnoj razini. Sve više profesionalaca, s obzirom na smanjenu ponudu posla, traži način da se bave svojom profesijom čak i ako to moraju raditi sami. Slobodno zapošljavanje postaje posao Pročitajte više…

Privatni sektor kreće u osvajanje prostora

Američka tvrtka SpaceX, koju je osnovao Elon Musk, postigla je veliki uspjeh lansiranjem rakete Falcon Heavy u svemir. Vatra je sukljala iz raketnih pojačavača i kolosalni oblak dima progutao je šatl. Raketa se vinula kroz plavo nebo, neumoljivo napredujući prema zvjezdanom crnom pokrivaču svemira. PokretanjePročitajte više…