U prethodnoj smo temi naučili nadzirano strojno učenje u kojem se modeli obučavaju pomoću označenih podataka pod nadzorom podataka o obuci. Ali može biti mnogo slučajeva u kojima nemamo označene podatke i moramo pronaći skrivene uzorke iz danog skupa podataka. Dakle, da bismo riješili takve vrste slučajeva u strojnom učenju, potrebne su nam tehnike učenja bez nadzora.
Što je učenje bez nadzora?
Kao što naziv sugerira, nenadzirano učenje je tehnika strojnog učenja u kojoj se modeli ne nadziru pomoću skupa podataka za obuku. Umjesto toga, modeli sami pronalaze skrivene obrasce i uvide iz danih podataka. Može se usporediti s učenjem koje se odvija u ljudskom mozgu dok uči nove stvari. Može se definirati kao:
niz u c++
Učenje bez nadzora je vrsta strojnog učenja u kojem se modeli obučavaju pomoću neoznačenog skupa podataka i dopušteno im je djelovati na tim podacima bez ikakvog nadzora.
Učenje bez nadzora ne može se izravno primijeniti na problem regresije ili klasifikacije jer za razliku od učenja pod nadzorom, imamo ulazne podatke, ali ne i odgovarajuće izlazne podatke. Cilj učenja bez nadzora je da pronaći temeljnu strukturu skupa podataka, grupirati te podatke prema sličnostima i predstaviti taj skup podataka u komprimiranom formatu .
Primjer: Pretpostavimo da algoritam za učenje bez nadzora dobije ulazni skup podataka koji sadrži slike različitih vrsta mačaka i pasa. Algoritam se nikada ne trenira na danom skupu podataka, što znači da nema pojma o značajkama skupa podataka. Zadatak algoritma za učenje bez nadzora je da samostalno identificira značajke slike. Algoritam za učenje bez nadzora izvršit će ovaj zadatak klasteriranjem skupa podataka slike u grupe prema sličnostima između slika.
Zašto koristiti učenje bez nadzora?
U nastavku su neki glavni razlozi koji opisuju važnost učenja bez nadzora:
- Učenje bez nadzora pomaže u pronalaženju korisnih uvida iz podataka.
- Učenje bez nadzora je slično kao što čovjek uči razmišljati na temelju vlastitih iskustava, što ga čini bližim pravoj umjetnoj inteligenciji.
- Učenje bez nadzora radi na neoznačenim i nekategoriziranim podacima što učenje bez nadzora čini važnijim.
- U stvarnom svijetu nemamo uvijek ulazne podatke s odgovarajućim izlazom pa nam je za rješavanje takvih slučajeva potrebno učenje bez nadzora.
Rad učenja bez nadzora
Rad nenadziranog učenja može se razumjeti dijagramom u nastavku:
Ovdje smo uzeli neoznačene ulazne podatke, što znači da nisu kategorizirani i odgovarajući izlazi također nisu dati. Sada se ovi neoznačeni ulazni podaci šalju modelu strojnog učenja kako bi ga se obučavao. Prvo će interpretirati neobrađene podatke kako bi pronašao skrivene obrasce iz podataka, a zatim će primijeniti odgovarajuće algoritme kao što je klasteriranje k-srednjih vrijednosti, stablo odlučivanja itd.
Nakon što primijeni odgovarajući algoritam, algoritam dijeli podatkovne objekte u skupine prema sličnostima i razlikama između objekata.
Vrste algoritama učenja bez nadzora:
Algoritam učenja bez nadzora može se dalje kategorizirati u dvije vrste problema:
Napomena: ove algoritme ćemo naučiti u kasnijim poglavljima.
Algoritmi za nenadzirano učenje:
Ispod je popis nekih popularnih algoritama učenja bez nadzora:
sadrži u nizu
Prednosti učenja bez nadzora
- Učenje bez nadzora koristi se za složenije zadatke u usporedbi s učenjem pod nadzorom jer kod učenja bez nadzora nemamo označene ulazne podatke.
- Učenje bez nadzora je poželjno jer je lako dobiti neoznačene podatke u usporedbi s označenim podacima.
Nedostaci nenadziranog učenja
- Učenje bez nadzora suštinski je teže od učenja pod nadzorom jer nema odgovarajuće rezultate.
- Rezultat algoritma učenja bez nadzora mogao bi biti manje točan jer ulazni podaci nisu označeni, a algoritmi ne znaju točan izlaz unaprijed.