Hiperparametri u strojnom učenju su oni parametri koje eksplicitno definira korisnik za kontrolu procesa učenja. Ti se hiperparametri koriste za poboljšanje učenja modela, a njihove se vrijednosti postavljaju prije početka procesa učenja modela.
U ovoj temi raspravljat ćemo o jednom od najvažnijih koncepata strojnog učenja, tj. o hiperparametrima, njihovim primjerima, podešavanju hiperparametara, kategorijama hiperparametara, kako se hiperparametar razlikuje od parametra u strojnom učenju? Ali prije nego što počnemo, prvo shvatimo Hiperparametar.
Što su hiperparametri?
U strojnom/dubinskom učenju model je predstavljen svojim parametrima. Nasuprot tome, proces obuke uključuje odabir najboljih/optimalnih hiperparametara koji se koriste u algoritmima učenja kako bi se dobio najbolji rezultat. Dakle, koji su to hiperparametri? Odgovor je, ' Hiperparametri su definirani kao parametri koje je eksplicitno definirao korisnik za kontrolu procesa učenja.'
Ovdje prefiks 'hiper' sugerira da su parametri parametri najviše razine koji se koriste u kontroli procesa učenja. Vrijednost hiperparametra odabire i postavlja inženjer strojnog učenja prije nego što algoritam za učenje počne trenirati model. Stoga su one vanjske u odnosu na model i njihove se vrijednosti ne mogu mijenjati tijekom procesa obuke .
sve velika slova prečac excel
Neki primjeri hiperparametara u strojnom učenju
- K u kNN ili algoritmu K-najbližeg susjeda
- Brzina učenja za treniranje neuronske mreže
- Omjer podjele trening-test
- Veličina serije
- Broj epoha
- Grane u stablu odlučivanja
- Broj klastera u algoritmu klasteriranja
Razlika između parametra i hiperparametra?
Uvijek postoji velika zbrka između parametara i hiperparametara ili hiperparametara modela. Dakle, kako bismo razjasnili ovu zabunu, shvatimo razliku između njih dvoje i kako su međusobno povezani.
Parametri modela:
Parametri modela su konfiguracijske varijable koje su unutar modela, a model ih sam uči. Na primjer , W Ponderi ili koeficijenti nezavisnih varijabli u modelu linearne regresije . ili Ponderi ili koeficijenti nezavisnih varijabli u SVM, ponderi i pristranosti neuronske mreže, središte klastera u klasteriranju. Neke ključne točke za parametre modela su sljedeće:
- Model ih koristi za izradu predviđanja.
- Model ih uči iz samih podataka
- Oni se obično ne postavljaju ručno.
- To je dio modela i ključ za algoritam strojnog učenja.
Hiperparametri modela:
Hiperparametri su oni parametri koje je eksplicitno definirao korisnik za kontrolu procesa učenja. Neke ključne točke za parametre modela su sljedeće:
- Obično ih ručno definira inženjer strojnog učenja.
- Ne može se znati točna najbolja vrijednost za hiperparametre za dati problem. Najbolja vrijednost može se odrediti ili pravilom palca ili pokušajem i pogreškom.
- Neki primjeri hiperparametara su stopa učenja za treniranje neuronske mreže, K u KNN algoritmu,
Kategorije hiperparametara
Općenito, hiperparametri se mogu podijeliti u dvije kategorije koje su navedene u nastavku:
Hiperparametar za optimizaciju
Proces odabira najboljih hiperparametara za korištenje poznat je kao ugađanje hiperparametara, a proces ugađanja također je poznat kao optimizacija hiperparametara. Za optimizaciju modela koriste se parametri optimizacije.
Neki od popularnih parametara optimizacije navedeni su u nastavku:
Napomena: Stopa učenja ključni je hiperparametar za optimizaciju modela, pa ako postoji zahtjev za podešavanjem samo jednog hiperparametra, predlaže se podešavanje stope učenja.
Hiperparametar za određene modele
Hiperparametri koji su uključeni u strukturu modela poznati su kao hiperparametri za specifične modele. One su navedene u nastavku:
Važno je specificirati hiperparametar broja skrivenih jedinica za neuronsku mrežu. Trebao bi biti između veličine ulaznog sloja i veličine izlaznog sloja. Točnije, broj skrivenih jedinica trebao bi biti 2/3 veličine ulaznog sloja, plus veličina izlaznog sloja.
Za složene funkcije potrebno je odrediti broj skrivenih jedinica, ali ne smije pretjerano odgovarati modelu.
Zaključak
Hiperparametri su parametri koji su eksplicitno definirani za kontrolu procesa učenja prije primjene algoritma strojnog učenja na skup podataka. Oni se koriste za određivanje kapaciteta učenja i složenosti modela. Neki od hiperparametara koriste se za optimizaciju modela, kao što je veličina serije, stopa učenja itd., a neki su specifični za modele, kao što je broj skrivenih slojeva itd.