Introducere în învățarea mașinii nesupravegheate

V-ați gândit vreodată cum un copil este capabil să distingă între mere și portocale atunci când nu știe ce sunt de fapt, cum au gustul, dar pe baza culorii și a mărimii, le poate separa în 2 grupuri fără informații prealabile? Ne putem aștepta la aceeași segmentare pe care o face un copil de la mașini dacă i se oferă informațiile despre culoare și dimensiune? Să vedem cum putem face asta! În acest subiect, vom învăța despre Învățarea mașinii nesupravegheate.

„Învățarea automată”, după cum sugerează termenul, învățăm mașini să facă sarcini asemănătoare omului și cum învață oamenii, fie de la cineva, fie prin observație. La fel ca oamenii, felul în care învață mașina.

Învățarea automată poate fi împărțită în 3 părți: -

  1. Învățare supravegheată
  2. Învățare nesupravegheată
  3. Consolidarea învățării

Tipuri de învățare automată

Învățarea de consolidare este învățarea bazată pe agent, care implică recompensă și pedeapsă la acțiunile întreprinse de un agent. Scopul final este de a maximiza recompensa generală în procesul de învățare din mediu.

Când aveți date de intrare-ieșire, pe scurt, date etichetate, de exemplu, înălțimea și greutatea dată pentru a determina dacă o persoană este bărbat sau femeie poate fi considerată o sarcină de învățare supravegheată (de la cineva în cazul oamenilor).

Dar în multe scenarii din viața reală, aceste date etichetate sau adnotate nu sunt întotdeauna disponibile. De multe ori ne confruntăm cu probleme de segmentare a obiectelor pe baza proprietăților lor care nu sunt menționate explicit. Cum să rezolvi această problemă? Ei bine, învățarea nesupravegheată este soluția.

Wikipedia spune că învățarea nesupravegheată este un tip de învățare Hebbian auto-organizată care ajută la găsirea tiparelor necunoscute anterior în setul de date fără etichete preexistente. În învățarea nesupravegheată, nu avem informații despre etichetă, dar totuși, dorim să obținem informații din datele bazate pe proprietățile sale diferite.

Tipuri de învățare automată nesupravegheată

Sarcinile de învățare nesupervizate pot fi împărțite în 3 categorii:

  1. Exploatarea regulilor de asociere
  2. clustering
  3. Sistem de recomandare

1. Asociația Rule Mining

Când avem date de tranzacție pentru ceva, poate fi pentru produsele vândute sau pentru orice date de tranzacție pentru asta contează, vreau să știu, există vreo relație ascunsă între cumpărător și produse sau produs cu produs, astfel încât să pot folosi cumva aceste informații să-mi măresc vânzările. Extragerea acestor relații este nucleul Asociației Rule Mining. Putem folosi algoritmi de creștere AIS, SETM, Apriori, FP pentru extragerea relațiilor.

2. Clustering

Prin clustering se pot face orice date în care nu avem informații despre clasă sau etichetă. Vrem să grupăm datele astfel încât observațiile cu proprietăți similare să aparțină aceluiași grup / grup și distanța dintre cluster să fie maximă. Întrucât distanța intra-cluster ar trebui să fie minimă. Putem aglomera datele alegătorilor pentru a afla părerea despre guvern sau produsele de grup, pe baza caracteristicilor și a utilizării acestora. Segmentează populația bazată pe caracteristicile veniturilor sau utilizează gruparea în vânzări și marketing.

Putem folosi K-Means, K-Means ++, K-Medoids, Fuzzy C-means (FCM),

Expectare-Maximizare (EM), Aglomerativ Clustering, DBSCAN, tipuri de Clustering Ierarhic ca legătură unică, legătură completă, legătură mediană, algoritmii metodei Ward pentru clustering.

3. Sistem de recomandare

Sistemul de recomandări este practic o extindere a extragerii regulilor de asociere, în sensul că în ARM extragem relații și în Sistemul de recomandări, folosim aceste relații pentru a recomanda ceva care are șanse mai mari de acceptare de către utilizatorul final. Sistemele de recomandare au câștigat popularitate după ce Netflix a anunțat un mare premiu de 1.000.000 USD în 2009.

Recomandarea Sistemelor funcționează pe datele tranzacționale, fie tranzacțiile financiare, comerțul electronic sau tranzacțiile alimentare. În prezent, jucătorii giganti din industria comerțului electronic atrag clienții făcând o recomandare personalizată pentru fiecare utilizator, pe baza istoricului de achiziții anterioare și a datelor de cumpărare a comportamentului similar de la alți utilizatori.

Metodele de dezvoltare a sistemelor de recomandare pot fi divizate în linii mari în filtrare colaborativă și filtrare pe bază de conținut. În Filtrare colaborativă avem din nou filtrare colaborativă utilizator-utilizator și Filtrare colaborativă articol-articol, care sunt abordări bazate pe memorie & Factorizare matricială și descompunere valorică singulară (SVD) sunt abordări bazate pe model.

Aplicații ale învățării nesupravegheate

Deoarece datele lumii cresc enorm în fiecare zi, învățarea nesupravegheată are multe aplicații. Creăm întotdeauna date utilizând platforme de social media sau un conținut video pe YouTube și de multe ori nici măcar nu facem în mod deliberat. Toate aceste date nu sunt structurate și etichetarea lor pentru sarcinile de învățare supravegheate va fi obositoare și costisitoare.

Următoarele sunt câteva aplicații interesante ale învățării automate nesupravegheate.

  1. Magazin alimentar sau magazin / piață de comerț electronic: Extragerea Asociației reguli din datele tranzacționale ale clienților și recomandări pentru consumatori să cumpere produse.
  2. Platforma Social Media: extrageți relațiile cu diferiți utilizatori, pentru a sugera produse sau servicii. Recomandă oamenilor noi pentru conectare socială.
  3. Servicii: Recomandări de servicii de călătorie, recomandări de case de închiriat sau servicii de potrivire.
  4. Bănci: clienții Cluster în funcție de tranzacțiile lor financiare. Cluster tranzacție frauduloasă pentru detectarea fraudelor.
  5. Politică: Opiniile alegătorilor din cluster cu privire la șansele câștigului pentru un anumit partid.
  6. Vizualizare date: prin clustering și t-distribuit T-Stochastic Neighbor Embedding (t-SNE) putem vizualiza date de înaltă dimensiune. De asemenea, acest lucru poate fi utilizat pentru reducerea dimensionalității.
  7. Divertisment: recomandări pentru filme, muzică, așa cum fac Netflix și Amazon.
  8. Segmentarea imaginii: porțiuni de imagini cluster bazate pe cele mai apropiate valori ale pixelilor.
  9. Conținut: ziare personalizate, recomandări de pagini Web, aplicații de învățare electronică și filtre de e-mail.
  10. Descoperire structurală: prin clustering, putem descoperi orice structură ascunsă în date. Cluster date pe twitter pentru analiza sentimentelor.

Concluzie

Învățarea automată nesupravegheată nu este prea cuantificabilă, dar poate rezolva o mulțime de probleme în care algoritmii supravegheți nu reușesc. Există multe aplicații pentru învățarea nesupravegheată în multe domenii în care avem date nestructurate și fără etichetare. Putem folosi tehnici de învățare nesupravegheate pentru a învăța mașinile noastre să facă o treabă mai bună decât noi. În ultimii ani, mașinile au depășit oamenii în termeni de sarcini care sunt considerate a fi rezolvate de oameni de secole. Sper că prin acest articol ai înțeles ce este și cum pot fi utilizate tehnici de învățare automată nesupravegheate pentru a rezolva problemele din lumea reală.

Articole recomandate

Acesta este un ghid pentru învățarea mașinii nesupervizate. Aici discutăm tipurile de învățare automată și tipurile de învățare automată nesupravegheată împreună cu aplicațiile sale. De asemenea, puteți arunca o privire la următoarele articole pentru a afla mai multe -

  1. Algoritmi de învățare a mașinilor
  2. Ce este învățarea automată?
  3. Introducere în învățarea mașinilor
  4. Instrumente de învățare a mașinilor
  5. Gruparea în învățarea mașinilor
  6. Hyperparameter Machine Learning
  7. Algoritmul de agregare ierarhică
  8. Gruparea Ierarhică | Gruparea aglomerativă și divizivă
  9. Top 8 etape ale ciclului de învățare a mașinilor

Categorie: