Gruparea în învățarea mașinilor - Cele mai multe metode și aplicații

Cuprins:

Anonim

Introducere în clustering în învățarea mașinilor

Vom înțelege mai întâi învățarea automată. Putem vedea datele crescând rapid în jurul nostru. Datele apar sub diferite forme, cum ar fi video, audio, imagini etc. Clustering în învățarea automată folosește aceste date pentru a răspunde la întrebare. De exemplu (detectarea bolilor pielii), medicul va folosi învățarea mașinii pentru a înțelege amprenta pe piele și va prezice ce fel de boală este. Clustering-ul nu este altceva decât gruparea unor seturi de date fără marcare. Haideți să luăm un exemplu de film (dvs. doriți să vizionați). S-ar putea să vă placă filmele romantice, dar sora dvs. îi plac filmele de comedie. S-ar putea să vă placă filmele romantice Bollywood sau filmele romantice de la Hollywood. Dar sora ta îi plac filmele de comedie Telegu, aici te poți vedea, iar sora ta are o alegere diferită de filme. Amândoi ați descoperit informații profunde despre filme. Aici am grupat setul de date (filme) fără marcă pentru a viziona filmul.

Cum funcționează clustering-ul în învățarea mașinii?

În grupări, grupăm un set de date fără marcă, care este cunoscut sub numele de învățare nesupravegheată. Atunci când grupăm pentru prima dată date fără marcaj, trebuie să găsim un grup similar. Când creăm un grup, trebuie să înțelegem caracteristicile seturilor de date, adică lucruri similare. Dacă creăm un grup după una sau două caracteristici, este ușor de măsurat asemănarea.

  • Exemplul # 1: Filme ale regizorului. După ce se face clusteringul, fiecărui cluster i se atribuie un număr de cluster care este cunoscut sub numele de ClusterID. Sistemul de învățare automată precum YouTube folosește clusterID pentru a reprezenta datele complexe cel mai ușor.
  • Exemplul # 2: YouTube folosește istoricul nostru de căutare sau istoricul vizionat și sugerează videoclipuri pe care le-am putea dori. Setul de date caracteristice pentru Facebook conține persoane pe care le urmăm, pagini pe care le urmăm, comentarii pe care le introducem, fotografii sau videoclipuri care ne plac, imagini sau fotografii pe care le etichetăm. Clustering video sau fotografie Facebook va înlocui un set de funcții cu un singur clusterID datorită comprimării datelor.

Top 4 metode de clustering în învățarea mașinii

Mai jos sunt prezentate metodele de clustering în învățarea mașinilor:

1. Ierarhice

Clustering-ul de nume definește un mod de lucru, această metodă formează un cluster într-un mod ierarhic. Noul cluster este format folosind o structură formată anterior. Trebuie să înțelegem diferențele dintre abordarea divizivă și abordarea aglomerativă. Aglomerativ este o abordare de jos în sus, începe cu puncte individuale dintr-un grup și combină unele arbitrare. Divizivul începe cu un singur cluster, toate punctele dintr-un cluster și îl împarte în mai multe cluster.

2. Bazat pe densitate

În această metodă, regiunea densă este considerată un grup care are unele asemănări. Este diferit de regiunea densă inferioară a spațiului obiectului. DBSCAN este cunoscut sub numele de clustering spațial bazat pe densitate al aplicațiilor cu zgomot. Pentru orientarea obiectelor de date, DBSCAN caută unele epsilon pe care le-am setat unele epsilon de rază și numărul minim de puncte. Într-o rază, dacă depășim un număr minim de puncte, atunci clasăm o densitate mare a clusterului. Astfel, putem considera date cu o regiune cu densitate ridicată. DBSCAN diferă de metoda centroidă de clustering, deoarece nu este o abordare strictă. Punctele de zgomot sunt puncte din zonele cu densitate scăzută care sunt lăsate fără etichetă sau etichetate ca valori. Acesta este motivul pentru care nu necesită K. specifice. Putem specifica puncte minime pentru regiunea cu densitate ridicată și raza dorită pentru o regiune să fie sau clustere care să fie.

3. Partitionare

Când avem un set de date de N număr de obiecte. Această metodă construiește „K” ca partiție a datelor. Această partiție este clusterul adică construiește K, partiția (K <= N).

Cerințe care trebuie îndeplinite:

  • Fiecare grup sau set de date trebuie să conțină cel puțin un obiect.
  • Fiecare obiect ar trebui să aparțină doar unui grup.

Unul dintre exemplele de partiționare este clustering-ul K-means.

4. pe bază de grilă

Spațiu obiect, un număr finit de celule formează o structură de grilă. Această metodă asigură procesarea rapidă a clusterului. Acestea sunt independente de spațiul obiectelor.

Aplicații de clustering în învățarea mașinilor

Mai jos sunt aplicațiile de agregare în învățare automată:

1. medical

Medicul poate folosi un algoritm de clustering pentru a găsi detectarea bolii. Să luăm un exemplu de boală tiroidiană. Setul de date despre boala tiroidiană poate fi identificat folosind algoritmul de clustering atunci când aplicăm învățare nesupravegheată pe un set de date care conține set de date tiroidian și non-tiroidian. Clustering-ul va identifica cauza bolii și va da o căutare a rezultatelor cu succes.

2. Rețeaua socială

Suntem generația erei internetului, putem întâlni orice persoană sau putem cunoaște orice identitate individuală prin intermediul internetului. Site-urile de rețea socială utilizează clustering pentru înțelegerea conținutului, fața oamenilor sau locația utilizatorului. Când învățarea nesupravegheată este folosită în social, este utilă pentru traducerea limbii. De exemplu, Instagram și Facebook oferă caracteristica de traducere a limbii.

3. Marketing

Putem observa sau observa că tehnologii diferite se dezvoltă alături de noi și oamenii atrag să folosească acele tehnologii precum marketingul cloud, digital. Pentru a atrage un număr mai mare de clienți, fiecare companie dezvoltă funcții și tehnologie ușor de utilizat. Pentru a înțelege clientul, putem folosi clustering. Clustering-ul va ajuta compania să înțeleagă segmentul de utilizatori și apoi să clasifice fiecare client. În acest fel, putem înțelege clientul și să găsim asemănări între clienți și să îi grupăm.

4. Banca

Am observat că în jurul nostru se întâmplă fraudă de bani, iar compania avertizează clienții în acest sens. Cu ajutorul grupărilor, companiile de asigurări pot găsi fraude, pot recunoaște clienții despre aceasta și pot înțelege politicile aduse de client.

5. Google

Google este unul dintre motoarele de căutare pe care le utilizează oamenii. Să luăm un exemplu atunci când căutăm informații precum magazinul pentru animale de companie din zonă, Google ne va oferi opțiuni diferite. Acesta este rezultatul aglomerării, grupării rezultatului similar care vă este oferit.

Concluzie

Am învățat despre clustering și învățare automată. Modul de clustering funcționează în învățarea mașinii. Informații despre învățarea nesupravegheată. Utilizarea în timp real a învățării nesupravegheate. Metode de clustering și modul în care fiecare metodă funcționează în învățarea mașinii.

Articol recomandat

Acesta este un ghid pentru clustering în învățarea mașinii. Aici discutăm principalele 4 metode de clustering în învățarea mașinii împreună cu aplicațiile. Puteți parcurge și alte articole sugerate pentru a afla mai multe -
  1. Cadre de învățare automată Top 10
  2. K- înseamnă algoritmul de aglomerare cu avantaje
  3. Introducere în tehnicile de învățare a mașinilor
  4. Modele de învățare automată | Top 5 tipuri
  5. Biblioteca de învățare automată C ++