Prezentare generală a funcțiilor pierderii în învățarea mașinii

La fel cum ne îndrumă profesorii, indiferent dacă suntem performanți sau nu în mediul academic, funcțiile Loss fac aceeași muncă. Este o metodă de evaluare a cât de bine modelează algoritmul nostru de date. Funcțiile de pierdere sunt principala sursă de evaluare în învățarea modernă a mașinilor. Când vă schimbați algoritmul pentru a vă îmbunătăți modelul, valoarea funcției pierderi vă va spune, dacă faceți un progres sau nu. Scopul nostru principal ar trebui să fie reducerea funcției de pierdere prin optimizare. În acest articol, vom discuta despre modul în care funcționează funcțiile de pierdere și diferite tipuri de funcții de pierdere.

Cum funcționează funcțiile de pierdere?

Cuvântul „Pierdere” precizează pedeapsa pentru nerealizarea rezultatului scontat. Dacă abaterea valorii preconizate a valorii preconizate de către modelul nostru este mare, atunci funcția de pierdere dă numărul mai mare ca ieșire și dacă abaterea este mică și mult mai aproape de valoarea scontată, acesta produce un număr mai mic.

Iată un exemplu când încercăm să prezicem prețul de vânzare al locuințelor în orașele de metrou.

previzibilă

Prețul de vânzare (în lakh)

Real

Prețul de vânzare (în lakh)

Abatere (Pierdere)
Bangalore: 45 0 (Toate predicțiile sunt corecte)
Pune: 35
Chennai: 40
Bangalore: 40Bangalore: 45 5 lakh pentru Bangalore, 2 lakh pentru Chennai
Pune: 35Pune: 35
Chennai: 38Chennai: 40
Bangalore: 43 2 lakh pentru Bangalore, 5 lakh pentru, Pune2 lakh pentru Chennai,
Pune: 30
Chennai: 45

Este important de menționat că, importanța abaterii nu contează, ceea ce contează aici este dacă valoarea prevăzută de modelul nostru este corectă sau greșită. Funcțiile de pierdere sunt diferite în funcție de declarația dvs. de problemă la care se aplică învățarea automată. Funcția de cost este un alt termen, care este utilizat în mod interschimbabil pentru funcția de pierdere, dar are un sens ușor diferit. O funcție de pierdere este pentru un singur exemplu de formare, în timp ce funcția de cost este pierderea medie în setul de date complet al trenului.

Tipuri de funcții de pierdere în învățarea mașinii

Mai jos se prezintă diferitele tipuri de funcții de pierdere în învățarea mașinii, care sunt următoarele:

1) Funcții de pierdere a regresiei:

Regresia liniară este un concept fundamental al acestei funcții. Funcțiile de pierdere a regresiei stabilesc o relație liniară între o variabilă dependentă (Y) și o variabilă independentă (X), de aceea încercăm să încadrăm cea mai bună linie din spațiu pe aceste variabile.

Y = X0 + X1 + X2 + X3 + X4 …. + Xn

X = variabile independente

Y = variabilă dependentă

  • Pierderea medie de eroare:

MSE (eroare L2) măsoară diferența medie pătrată între valorile reale și cele prevăzute de model. Ieșirea este un singur număr asociat cu un set de valori. Scopul nostru este de a reduce MSE pentru a îmbunătăți precizia modelului.

Considerăm ecuația liniară, y = mx + c, putem derula MSE ca:

MSE = 1 / N ∑i = 1 la n (y (i) - (mx (i) + b)) 2

Aici, N este numărul total de puncte de date, 1 / N ∑i = 1 până la n este valoarea medie și y (i) este valoarea reală și mx (i) + b valoarea prevăzută.

  • Pierderea medie a erorii logaritmice pătrate (MSLE):

MSLE măsoară raportul dintre valoarea reală și valoarea prevăzută. Introduce o asimetrie în curba de eroare. MSLE îi pasă doar de diferența procentuală a valorilor reale și previzionate. Poate fi o alegere bună ca funcție de pierdere, atunci când dorim să prezicem prețurile de vânzare a locuințelor, prețurile de vânzare a panificației și datele sunt continue.

Aici, pierderea poate fi calculată ca media datelor observate ale diferențelor pătrate dintre valorile reale transformate în jurnal și cele previzionate, care pot fi date ca:

L = 1nnΣi = 1 (log (y (i) +1) -log (y (i) +1)) 2

  • Eroare absolută medie (MAE):

MAE calculează suma diferențelor absolute între variabilele reale și cele previzionate. Aceasta înseamnă că măsoară magnitudinea medie a erorilor dintr-un set de valori prezise. Folosirea erorii pătrate medii este mai ușor de rezolvat, dar utilizarea erorii absolute este mai robustă pentru contururi. Outliers sunt acele valori, care se abat extrem de de la alte puncte de date observate.

MAE poate fi calculat ca:

L = 1nnΣi = 1||y (i) - y (i) ||

2) Funcții de pierdere a clasificării binare:

Aceste funcții de pierdere sunt făcute pentru a măsura performanțele modelului de clasificare. În acest caz, punctelor de date li se atribuie una dintre etichete, respectiv 0 sau 1. Mai mult, ele pot fi clasificate ca:

  • Entropie binară încrucișată

Este o funcție implicită de pierdere pentru problemele de clasificare binară. Pierderea între entropie calculează performanța unui model de clasificare care oferă o ieșire a unei valori de probabilitate între 0 și 1. Pierderea de entropie încrucișată crește pe măsură ce valoarea de probabilitate prevăzută se abate de la eticheta reală.

  • Pierderea balamalei

Pierderea de balamale poate fi folosită ca o alternativă la entropia încrucișată, care a fost inițial dezvoltată pentru a fi utilizată cu un algoritm de mașină vector de susținere. Pierderea de balamale funcționează cel mai bine cu problema de clasificare, deoarece valorile țintă sunt în setul de (-1, 1). Permite alocarea mai multor erori atunci când există o diferență de semn între valorile reale și cele previzionate. Prin urmare, rezultă performanțe mai bune decât entropia încrucișată.

  • Pierdere pătrată de balamale

O extensie a pierderii de balamale, care calculează pur și simplu pătratul scorului pierderii de balama. Acesta reduce funcția de eroare și face mai ușor să lucreze numeric. Acesta găsește limita de clasificare care specifică marja maximă dintre punctele de date din diverse clase. Pierderea pătrată a balamalei se potrivește perfect pentru DA sau NU genul de probleme de decizie, unde abaterea probabilității nu este preocuparea.

3) Funcții de pierdere a clasificării cu mai multe clase:

Clasificarea cu mai multe clase este modelele predictive în care punctele de date sunt alocate mai mult de două clase. Fiecărei clase i se atribuie o valoare unică de la 0 la (Number_of_classes - 1). Este foarte recomandat pentru probleme de clasificare a imaginilor sau a textului, unde o singură lucrare poate avea mai multe subiecte.

  • Entropie încrucișată în mai multe clase

În acest caz, valorile țintă sunt în setul de la 0 la n adică (0, 1, 2, 3 … n). Calculează un scor care are o diferență medie între valorile probabilității reale și cele prevăzute și scorul este minimizat pentru a atinge cea mai bună precizie posibilă. Entropia încrucișată în mai multe clase este funcția implicită de pierdere pentru problemele de clasificare a textului.

  • Entropie încrucișată cu mai multe clase

Un proces de codare la cald face ca entropia încrucișată în mai multe clase să fie dificil de gestionat cu un număr mare de puncte de date. Întreaga entropie încrucișată rezolvă această problemă prin efectuarea calculului de eroare fără a utiliza o codare la cald.

  • Kullback Leibler Diferență Pierdere

Pierderea de divergență KL calculează divergența dintre distribuția probabilității și distribuția de bază și află cât de multe informații se pierd în termeni de biți. Rezultatul este o valoare non-negativă care specifică cât de aproape sunt două distribuții de probabilitate. Pentru a descrie divergența KL în termeni de vedere probabilistică, se utilizează raportul de probabilitate.

În acest articol, inițial, am înțeles cum funcționează funcțiile de pierdere și apoi am continuat să explorăm o listă cuprinzătoare a funcțiilor de pierdere cu exemple de caz utilizate. Cu toate acestea, înțelegerea practic este mai benefic, așa că încercați să citiți mai multe și să îl implementați. Îți va clarifica îndoielile.

Articole recomandate

Acesta este un ghid pentru funcțiile de pierdere în învățarea mașinii. Aici vom discuta despre cum funcționează funcțiile de pierdere și tipurile de funcții de pierdere în învățarea mașinii. De asemenea, puteți arunca o privire la următoarele articole pentru a afla mai multe -

  1. Metode de învățare a mașinilor
  2. Introducere în învățarea mașinilor
  3. Tehnologii de date mari
  4. Software de analiză de date mari
  5. Aflați catogoriile hiperparametrului
  6. Ciclul de viață al învățării mașinilor | Top 8 etape

Categorie: