Introducere în metodele de învățare a mașinilor

Următorul articol, Metode de învățare prin mașină oferă o prezentare a celor mai utilizate metode în învățarea mașinilor. Învățarea automată este o tehnică care face ca un computer să poată „învăța” lucrurile de unul singur. Algoritmii își îmbunătățesc în mod adaptiv performanța pe măsură ce datele disponibile pentru învățare cresc. Aceasta este mai multe date, cu atât modelul nostru va fi mai exact.

Cum învață mașinile?

Există diverse metode pentru a face acest lucru. Ce metodă de urmat depinde complet de afirmația problemei. În funcție de setul de date și de problema noastră, există două moduri diferite de a merge mai profund. Una este învățarea supravegheată, iar cealaltă este învățarea nesupravegheată. Următorul grafic explică clasificarea suplimentară a metodelor de învățare automată. Le vom discuta unul câte unul.

Uitați-vă la următoarea diagramă!

Să înțelegem ce înseamnă învățarea supravegheată

Învățare supravegheată

După cum sugerează și numele, imaginați-vă un profesor sau un supraveghetor care vă ajută să învățați. Același lucru este valabil și pentru mașini. Instruim sau învățăm mașina folosind date care sunt etichetate.

Unele dintre cele mai cool aplicații de învățare supravegheate sunt:

  • Analiza sentimentelor (Twitter, Facebook, Netflix, YouTube, etc)
  • Prelucrarea limbajului natural
  • Clasificarea imaginii
  • Analiza predictivă
  • Recunoasterea formelor
  • Detectare spam
  • Prelucrare discurs / secvență

Acum, învățarea supravegheată este împărțită în continuare în clasificare și regresie. Hai să înțelegem asta.

Clasificare

Clasificarea este procesul de a găsi un model care ajută la separarea datelor în clase categorice diferite. În acest proces, datele sunt clasificate în etichete diferite, în funcție de unii parametri dați la intrare, iar apoi etichetele sunt prevăzute pentru date. Categoric înseamnă variabila de ieșire este o categorie, adică roșu sau negru, spam sau nu spam, diabetic sau non-diabetic etc.

Modelele de clasificare includ mașina vectorului de asistență (SVM), vecinul cel mai apropiat de K (KNN), Naive Bayes etc.

a) Clasificator de mașini vectoriale de suport (SVM)

SVM este o metodă de învățare supravegheată, care examinează datele și le sortează într-una din cele două categorii. Folosesc un hiperplan pentru a clasifica datele. Un clasificator liniar discriminatoriu încearcă să deseneze o linie dreaptă care separă cele două seturi de date și creează astfel un model de clasificare. Pur și simplu încearcă să găsească o linie sau o curbă (în două dimensiuni) sau o varietate (în mai multe dimensiuni) care să împartă clasele între ele.

Notă - Pentru clasificarea multiclase SVM folosește „one vs rest”, ceea ce înseamnă calcularea diferitelor SVM pentru fiecare clasă.

b) Clasificatorul de vecini cel mai apropiat de K (KNN)

  • Dacă citiți cu atenție, numele în sine sugerează ce face algoritmul. KNN consideră că punctele de date care sunt mai apropiate, sunt mult mai asemănătoare din punct de vedere al caracteristicilor și, prin urmare, sunt mai susceptibile să aparțină aceleiași clase ca vecinul. Pentru orice punct de date nou, distanța față de toate celelalte puncte de date este calculată și clasa este decisă pe baza vecinilor apropiați K. Da, poate suna șchiop, dar pentru o parte din clasificare, funcționează ca orice.
  • Un punct de date este clasificat după numărul maxim de voturi al vecinilor săi, apoi punctul de date este atribuit clasei cele mai apropiate dintre vecinii săi k.
  • În KNN, nu este necesară o învățare a modelului și toate lucrările se petrec în momentul în care se solicită o predicție. De aceea, KNN este adesea denumit un algoritm de învățare leneș.

c) Clasificatorul Naïve Bayes

  • Naïve Bayes este un algoritm de învățare automată care este foarte recomandat pentru probleme de clasificare a textului. Se bazează pe teorema probabilității Bayes. Acești clasificatori sunt numiți naivi, deoarece presupun că variabilele caracteristice sunt independente unele de altele. Asta înseamnă, de exemplu, avem o propoziție completă pentru introducere, apoi Naïve Bayes presupune că fiecare cuvânt dintr-o propoziție este independent de celelalte. Și apoi clasificați-le în consecință. Știu, pare destul de naiv, dar este o alegere excelentă pentru problemele de clasificare a textului și este o alegere populară pentru clasificarea prin e-mailuri spam.
  • Oferă diferite tipuri de algoritmi Naive Bayes precum BernoulliNB, GaussianNB, MultinomialNB.
  • Consideră că toate caracteristicile nu au legătură, deci nu poate învăța relația dintre caracteristici. De exemplu, să spunem, lui Varun îi place să mănânce burgeri, îi place să mănânce cartofi prăjiți cu cocs. Dar nu-i place să mănânce un burger și o combinație de cartofi prăjiți cu cocs împreună. Aici, Naïve Bayes nu poate învăța relația dintre două caracteristici, dar învață doar importanța caracteristicilor individuale.

Acum să trecem la cealaltă parte a metodei noastre de învățare supravegheată, care este o regresie.

regresiune

Regresia este procesul de a găsi un model care ajută la diferențierea datelor folosind valori continue. În acest sens, natura datelor prevăzute este ordonată. Unele dintre cele mai utilizate modele de regresie includ regresia liniară, pădurea aleatorie (arbori de decizie), rețelele neuronale.

Regresie liniara

  • Una dintre cele mai simple abordări în învățarea supravegheată, care este utilă pentru a prezice răspunsul cantitativ.
  • Regresia liniară include găsirea celei mai potrivite linii drepte prin puncte. Cea mai potrivită linie se numește linie de regresie. Cea mai bună linie de potrivire nu trece exact prin toate punctele de date, dar în schimb încearcă că este mai bine să te apropii de ele.
  • Este algoritmul utilizat pe scară largă pentru date continue. Cu toate acestea, se concentrează doar pe media variabilei dependente și se limitează la o relație liniară.
  • Regresia liniară poate fi utilizată pentru seriile de timp, previziuni de tendințe. Poate prezice vânzările viitoare, pe baza datelor anterioare.

Învățare nesupravegheată

  • Învățarea nesupravegheată se bazează pe abordarea care poate fi considerată ca absența unui profesor și, prin urmare, a măsurilor de eroare absolută. Este util atunci când este necesar să înveți clustering sau grupare de elemente. Elementele pot fi grupate (grupate) în funcție de similaritatea lor.
  • În procesul de învățare nesupravegheat, datele nu sunt marcate, nu sunt clasificate și algoritmii sistemului acționează asupra datelor fără o pregătire prealabilă. Algoritmii de învățare nesupravegheați pot efectua sarcini mai complexe decât algoritmii de învățare supravegheată.
  • Învățarea nesupravegheată include clustering-ul care se poate face folosind K înseamnă clustering, ierarhic, amestec gaussian, model Markov ascuns.

Aplicațiile de învățare nesupervizate sunt:

  1. Detectarea similarității
  2. Etichetare automată
  3. Segmentarea obiectelor (cum ar fi Persoana, Animalul, Filmele)

clustering

  • Clustering-ul este o tehnică de învățare nesupravegheată care este folosită pentru analiza datelor în multe domenii. Algoritmul de clustering este util atunci când dorim să obținem informații detaliate despre datele noastre.
  • Un exemplu real de clustering ar fi grupurile de genuri Netflix, care sunt împărțite pentru clienți țintă diferiți, inclusiv interese, demografie, stiluri de viață etc. Clienți.

a) K înseamnă Clustering

  • K înseamnă algoritmul de clustering încearcă să împartă datele necunoscute date în clustere. Selectează la întâmplare „k” clusterii centroid, calculează distanța dintre punctele de date și clusterii centroid și apoi, în cele din urmă, atribuie punctul de date centroidului cluster a cărui distanță este minimă de toate centreidele de cluster.
  • În mijloace k, grupurile sunt definite de cel mai apropiat centroid pentru fiecare grup. Acest centroid acționează ca „Creierul” algoritmului, dobândesc punctele de date care sunt cele mai apropiate de ele și apoi le adaugă la clustere.

b) Gruparea Ierarhică

Gruparea ierarhică este aproape similară cu cea a grupării normale, cu excepția cazului în care doriți să construiți o ierarhie de clustere. Acest lucru poate fi util atunci când doriți să decideți numărul de clustere. De exemplu, să presupunem că creați grupuri de articole diferite pe magazinul online de alimente. În prima pagină, doriți câteva elemente largi și, după ce faceți clic pe unul dintre elemente, se deschide anumite categorii, adică grupuri mai specifice.

Reducerea dimensionalității

Reducerea dimensionalității poate fi considerată ca compresie a unui fișier. Înseamnă, preluarea informațiilor care nu sunt relevante. Acesta reduce complexitatea datelor și încearcă să păstreze datele semnificative. De exemplu, în compresia imaginii, reducem dimensionalitatea spațiului în care imaginea rămâne așa cum este, fără a distruge prea mult conținutul semnificativ din imagine.

PCA pentru vizualizarea datelor

Analiza componentelor principale (PCA) este o metodă de reducere a dimensiunii care poate fi utilă pentru vizualizarea datelor dumneavoastră. PCA este utilizat pentru a comprima datele cu dimensiuni superioare cu date cu dimensiuni inferioare, adică putem folosi PCA pentru a reduce datele cu patru dimensiuni în trei sau 2 dimensiuni, astfel încât să putem vizualiza și obține o mai bună înțelegere a datelor.

Articole recomandate

Acesta este un ghid pentru metodele de învățare a mașinilor. Aici am discutat o introducere, Cum învață mașinile? clasificări ale învățării automate și a unui organigraf împreună cu o explicație detaliată. Puteți parcurge și alte articole sugerate pentru a afla mai multe -

  1. Arhitectura de învățare a mașinilor
  2. Cadre de învățare automată
  3. Instrumente de învățare a mașinilor
  4. Tehnici de învățare a mașinilor
  5. Hyperparameter Machine Learning
  6. Algoritmul de agregare ierarhică
  7. Gruparea Ierarhică | Gruparea aglomerativă și divizivă

Categorie: