logo

Strojno učenje bez nadzora

U prethodnoj smo temi naučili nadzirano strojno učenje u kojem se modeli obučavaju pomoću označenih podataka pod nadzorom podataka o obuci. Ali može biti mnogo slučajeva u kojima nemamo označene podatke i moramo pronaći skrivene uzorke iz danog skupa podataka. Dakle, da bismo riješili takve vrste slučajeva u strojnom učenju, potrebne su nam tehnike učenja bez nadzora.

Što je učenje bez nadzora?

Kao što naziv sugerira, nenadzirano učenje je tehnika strojnog učenja u kojoj se modeli ne nadziru pomoću skupa podataka za obuku. Umjesto toga, modeli sami pronalaze skrivene obrasce i uvide iz danih podataka. Može se usporediti s učenjem koje se odvija u ljudskom mozgu dok uči nove stvari. Može se definirati kao:

niz u c++
Učenje bez nadzora je vrsta strojnog učenja u kojem se modeli obučavaju pomoću neoznačenog skupa podataka i dopušteno im je djelovati na tim podacima bez ikakvog nadzora.

Učenje bez nadzora ne može se izravno primijeniti na problem regresije ili klasifikacije jer za razliku od učenja pod nadzorom, imamo ulazne podatke, ali ne i odgovarajuće izlazne podatke. Cilj učenja bez nadzora je da pronaći temeljnu strukturu skupa podataka, grupirati te podatke prema sličnostima i predstaviti taj skup podataka u komprimiranom formatu .

Primjer: Pretpostavimo da algoritam za učenje bez nadzora dobije ulazni skup podataka koji sadrži slike različitih vrsta mačaka i pasa. Algoritam se nikada ne trenira na danom skupu podataka, što znači da nema pojma o značajkama skupa podataka. Zadatak algoritma za učenje bez nadzora je da samostalno identificira značajke slike. Algoritam za učenje bez nadzora izvršit će ovaj zadatak klasteriranjem skupa podataka slike u grupe prema sličnostima između slika.

Nadzirano strojno učenje

Zašto koristiti učenje bez nadzora?

U nastavku su neki glavni razlozi koji opisuju važnost učenja bez nadzora:

  • Učenje bez nadzora pomaže u pronalaženju korisnih uvida iz podataka.
  • Učenje bez nadzora je slično kao što čovjek uči razmišljati na temelju vlastitih iskustava, što ga čini bližim pravoj umjetnoj inteligenciji.
  • Učenje bez nadzora radi na neoznačenim i nekategoriziranim podacima što učenje bez nadzora čini važnijim.
  • U stvarnom svijetu nemamo uvijek ulazne podatke s odgovarajućim izlazom pa nam je za rješavanje takvih slučajeva potrebno učenje bez nadzora.

Rad učenja bez nadzora

Rad nenadziranog učenja može se razumjeti dijagramom u nastavku:

Nadzirano strojno učenje

Ovdje smo uzeli neoznačene ulazne podatke, što znači da nisu kategorizirani i odgovarajući izlazi također nisu dati. Sada se ovi neoznačeni ulazni podaci šalju modelu strojnog učenja kako bi ga se obučavao. Prvo će interpretirati neobrađene podatke kako bi pronašao skrivene obrasce iz podataka, a zatim će primijeniti odgovarajuće algoritme kao što je klasteriranje k-srednjih vrijednosti, stablo odlučivanja itd.

Nakon što primijeni odgovarajući algoritam, algoritam dijeli podatkovne objekte u skupine prema sličnostima i razlikama između objekata.

Vrste algoritama učenja bez nadzora:

Algoritam učenja bez nadzora može se dalje kategorizirati u dvije vrste problema:

Nadzirano strojno učenje
    Grupiranje: Grupiranje je metoda grupiranja objekata u klastere tako da objekti s najviše sličnosti ostaju u grupi i imaju manje ili nimalo sličnosti s objektima druge grupe. Klasterska analiza pronalazi sličnosti između podatkovnih objekata i kategorizira ih prema prisutnosti i odsutnosti tih zajedničkih karakteristika.Udruga: Pravilo pridruživanja je metoda učenja bez nadzora koja se koristi za pronalaženje odnosa između varijabli u velikoj bazi podataka. Određuje skup stavki koje se zajedno pojavljuju u skupu podataka. Pravilo udruživanja čini marketinšku strategiju učinkovitijom. Kao što su ljudi koji kupe X stavku (pretpostavimo kruh) također imaju tendenciju kupiti Y (maslac/džem) stavku. Tipičan primjer pravila pridruživanja je analiza tržišne košarice.

Napomena: ove algoritme ćemo naučiti u kasnijim poglavljima.

Algoritmi za nenadzirano učenje:

Ispod je popis nekih popularnih algoritama učenja bez nadzora:

sadrži u nizu
    K-znači grupiranje KNN (k-najbliži susjedi) Hijerarhijsko grupiranje Otkrivanje anomalija Neuronske mreže Analiza glavnih komponenti Neovisna analiza komponenti Apriori algoritam Dekompozicija singularne vrijednosti

Prednosti učenja bez nadzora

  • Učenje bez nadzora koristi se za složenije zadatke u usporedbi s učenjem pod nadzorom jer kod učenja bez nadzora nemamo označene ulazne podatke.
  • Učenje bez nadzora je poželjno jer je lako dobiti neoznačene podatke u usporedbi s označenim podacima.

Nedostaci nenadziranog učenja

  • Učenje bez nadzora suštinski je teže od učenja pod nadzorom jer nema odgovarajuće rezultate.
  • Rezultat algoritma učenja bez nadzora mogao bi biti manje točan jer ulazni podaci nisu označeni, a algoritmi ne znaju točan izlaz unaprijed.