Nadzirano učenje je tip strojnog učenja u kojem se strojevi treniraju pomoću dobro 'označenih' podataka o treningu, a na temelju tih podataka strojevi predviđaju izlaz. Označeni podaci znače da su neki ulazni podaci već označeni ispravnim izlazom.
U nadziranom učenju, podaci o obuci koji se daju strojevima djeluju kao nadzornik koji uči strojeve da točno predvide izlaz. Primjenjuje isti koncept kao što učenik uči pod nadzorom učitelja.
Nadzirano učenje je proces pružanja ulaznih podataka, kao i točnih izlaznih podataka modelu strojnog učenja. Cilj algoritma nadziranog učenja je da pronađite funkciju preslikavanja za preslikavanje ulazne varijable(x) s izlaznom varijablom(y) .
U stvarnom svijetu nadzirano učenje može se koristiti za Procjena rizika, klasifikacija slika, otkrivanje prijevara, filtriranje neželjene pošte itd.
Kako funkcionira nadzirano učenje?
U nadziranom učenju, modeli se obučavaju pomoću označenog skupa podataka, gdje model uči o svakoj vrsti podataka. Nakon što je proces obuke završen, model se testira na temelju testnih podataka (podskup skupa obuke), a zatim predviđa izlaz.
Rad nadziranog učenja može se lako razumjeti pomoću primjera i dijagrama u nastavku:
Pretpostavimo da imamo skup podataka različitih vrsta oblika koji uključuje kvadrat, pravokutnik, trokut i poligon. Sada je prvi korak da trebamo uvježbati model za svaki oblik.
- Ako dati oblik ima četiri strane, a sve su strane jednake, tada će biti označen kao a Kvadrat .
- Ako dati oblik ima tri strane, tada će biti označen kao a trokut .
- Ako zadani oblik ima šest jednakih stranica tada će biti označen kao šesterokut .
Sada, nakon treninga, testiramo naš model pomoću test seta, a zadatak modela je identificirati oblik.
Stroj je već uvježban na svim vrstama oblika, a kada pronađe novi oblik, klasificira ga na temelju niza strana i predviđa izlaz.
Koraci uključeni u nadzirano učenje:
- Prvo odredite vrstu skupa podataka za obuku
- Prikupite označene podatke o treningu.
- Podijelite skup podataka za obuku u obuku skup podataka, testni skup podataka i validacijski skup podataka .
- Odredite ulazne značajke skupa podataka za obuku, koji bi trebao imati dovoljno znanja kako bi model mogao točno predvidjeti izlaz.
- Odredite odgovarajući algoritam za model, kao što je stroj potpornih vektora, stablo odlučivanja itd.
- Izvršite algoritam na skupu podataka za obuku. Ponekad su nam potrebni validacijski skupovi kao kontrolni parametri, koji su podskup skupova podataka za obuku.
- Ocijenite točnost modela pružanjem testnog skupa. Ako model predviđa točan izlaz, to znači da je naš model točan.
Vrste nadziranih algoritama strojnog učenja:
Nadzirano učenje može se dalje podijeliti u dvije vrste problema:
1. Regresija
ms word alatna traka za brzi pristup
Regresijski algoritmi se koriste ako postoji odnos između ulazne varijable i izlazne varijable. Koristi se za predviđanje kontinuiranih varijabli, poput vremenske prognoze, tržišnih trendova itd. U nastavku su navedeni neki popularni regresijski algoritmi koji se uče pod nadzorom:
- Linearna regresija
- Regresijska stabla
- Nelinearna regresija
- Bayesova linearna regresija
- Polinomska regresija
2. Klasifikacija
Klasifikacijski algoritmi se koriste kada je izlazna varijabla kategorička, što znači da postoje dvije klase kao što su Da-Ne, Muško-Žensko, Točno-Netočno, itd.
Filtriranje neželjene pošte,
- Slučajna šuma
- Stabla odlučivanja
- Logistička regresija
- Potporni vektorski strojevi
Napomena: O ovim algoritmima ćemo detaljno govoriti u kasnijim poglavljima.
Prednosti nadziranog učenja:
- Uz pomoć nadziranog učenja, model može predvidjeti učinak na temelju prethodnih iskustava.
- U nadziranom učenju možemo imati točnu predodžbu o klasama objekata.
- Model nadziranog učenja pomaže nam riješiti razne probleme iz stvarnog svijeta kao što su otkrivanje prijevara, filtriranje spama itd.
Nedostaci nadziranog učenja:
- Modeli učenja pod nadzorom nisu prikladni za rješavanje složenih zadataka.
- Nadzirano učenje ne može predvidjeti ispravan rezultat ako se testni podaci razlikuju od skupa podataka za obuku.
- Obuka je zahtijevala mnogo vremena za računanje.
- U nadziranom učenju potrebno nam je dovoljno znanja o klasama objekta.