Introducere în mașina Boltzmann restricționată

Mașina Boltzmann restrânsă este o metodă care poate găsi automat modele în date prin reconstrucția intrării noastre. Geoff Hinton este fondatorul învățării profunde. RBM este o rețea superficială cu două straturi în care primul este vizibil, iar următorul este stratul ascuns. Fiecare singur nod din stratul vizibil este unit cu fiecare nod din stratul ascuns. Mașina Boltzmann restrânsă este considerată ca fiind restricționată, deoarece două noduri ale aceluiași strat nu formează o conexiune. Un RBM este echivalentul numeric al traducătorului cu două sensuri. În calea înainte, un RBM primește intrarea și o transformă într-un set de numere care codifică intrarea. În calea de întoarcere, este nevoie de acest lucru ca rezultat și procesează acest set de intrări și le traduce în sens invers pentru a forma intrările retrase. O rețea super-instruită va putea efectua această tranziție inversă cu o veridicitate ridicată. În doi pași, greutatea și valorile au un rol foarte important. Acestea permit RBM să decodeze interrelațiile dintre intrări și, de asemenea, ajută RBM să decidă ce valori de intrare sunt cele mai importante în detectarea rezultatelor corecte.

Funcționarea mașinii Boltzmann restrânse

Fiecare nod vizibil primește o valoare de nivel scăzut de la un nod din setul de date. La primul nod al stratului invizibil, X este format dintr-un produs cu greutate și adăugat la o prejudecată. Rezultatul acestui proces este alimentat cu activarea care produce puterea semnalului de intrare sau a ieșirii nodului dat.

În procesul următor, mai multe intrări s-ar alătura la un singur nod ascuns. Fiecare X este combinat cu greutatea individuală, adăugarea produsului este asociată valorilor și din nou rezultatul este trecut prin activare pentru a da ieșirea nodului. La fiecare nod invizibil, fiecare intrare X este combinată cu greutatea individuală W. Intrarea X are trei greutăți aici, făcând douăsprezece împreună. Greutatea formată între strat devine un tablou în care rândurile sunt corecte pentru nodurile de intrare și coloanele sunt satisfăcute cu nodurile de ieșire.

Fiecare nod invizibil primește patru răspunsuri înmulțite cu greutatea lor. Adăugarea acestui efect este din nou adăugată la valoare. Aceasta acționează ca un catalizator pentru ca un anumit proces de activare să se întâmple și rezultatul este alimentat din nou la algoritmul de activare care produce fiecare ieșire pentru fiecare intrare invizibilă.

Primul model derivat aici este modelul bazat pe energie. Acest model asociază energia scalară cu fiecare configurație a variabilei. Acest model definește distribuția probabilității printr-o funcție energetică după cum urmează,

(1)

Aici Z este factorul de normalizare. Este funcția de partiție în termeni de sisteme fizice

În această funcție bazată pe energie urmează o regresie logistică pe care primul pas o va defini jurnalul. probabilitatea și următoarea va defini funcția de pierdere ca fiind o probabilitate negativă.

folosind gradientul stocastic; Unde sunt parametrii,

modelul bazat pe energie cu o unitate ascunsă este definit ca „h”

Partea observată este denumită „x”

Din ecuația (1), ecuația energiei libere F (x) este definită după cum urmează

(2)

(3)

Gradientul negativ are următoarea formă,

(4)

Ecuația de mai sus are două forme, forma pozitivă și cea negativă. Termenul pozitiv și negativ nu este reprezentat de semne ale ecuațiilor. Ele arată efectul densității probabilității. Prima parte arată probabilitatea de a reduce energia liberă corespunzătoare. A doua parte arată redusă probabilitatea eșantioanelor generate. Apoi, gradientul este determinat după cum urmează,

(5)

Aici N este particule negative. În acest model bazat pe energie, este dificil de identificat gradientul în mod analitic, deoarece include calculul

Prin urmare, în acest model EBM, avem o observație liniară care nu este în măsură să descrie datele cu exactitate. Deci, în modelul următor Mașină Boltzmann restrânsă, stratul ascuns are mai multă precizie și prevenire a pierderilor de date. Funcția de energie RBM este definită ca:

(6)

Aici, W este conectarea greutății între straturile vizibile și cele ascunse. b este decalat al stratului vizibil.c este decalat al stratului ascuns. prin conversia la energie liberă,

În RBM, unitățile stratului vizibil și ascuns sunt complet independente, care pot fi scrise astfel:

Din ecuația 6 și 2, o versiune probabilistică a funcției de activare a neuronilor,

(7)

(8)

Aceasta este simplificată în continuare

(9)

Combinând ecuația 5 și 9,

(10)

Prelevare de probe într-o mașină Boltzmann restricționată

Eșantionarea Gibbs a articulației de N variabile aleatorii se realizează printr-o secvență de N sub-trepte de eșantionare a formularului Unde

conține celelalte variabile aleatorii din cu excepția.

În RBM, S este un set de unități vizibile și ascunse. Cele două părți sunt independente care pot efectua sau bloca eșantionarea Gibbs. Aici unitatea vizibilă efectuează eșantionarea și dă valoare fixă ​​unităților ascunse, simultan unitățile ascunse furnizează valori fixe unității vizibile prin eșantionare

aici, este set de toate unitățile ascunse. Un exemplu este ales la întâmplare pentru a fi 1 (versus 0) cu probabilitate, și în mod similar, este ales la întâmplare pentru a fi 1 (versus 0) cu probabilitate

Divergență contrastivă

Este utilizat ca catalizator pentru a accelera procesul de eșantionare
Din moment ce ne așteptăm să fie adevărat, ne așteptăm valoarea de distribuție să fie apropiată de P, astfel încât să formeze o convergență cu distribuția finală a P

Dar divergența contrastivă nu așteaptă să convergă lanțul. Eșantionul este obținut numai după procesul lui Gibb, așa că setăm aici k = 1 unde funcționează surprinzător de bine.

Divergență contrastivă persistentă

Aceasta este o altă metodă pentru formularul de eșantionare de aproximare. Este o stare persistentă pentru fiecare metodă de eșantionare în care se extrag probe noi prin simpla schimbare a parametrilor lui K.

Straturile mașinii Boltzmann restrânse

Mașina Boltzmann restrânsă are două straturi, rețele neuronale superficiale, care se combină pentru a forma un bloc de rețele de credințe profunde. Primul strat este stratul vizibil, iar celălalt strat este cel ascuns. Fiecare unitate se referă la un cerc asemănător neuronului numit nod. Nodurile din stratul ascuns sunt conectate la nodurile din stratul vizibil. Dar două noduri ale aceluiași strat nu sunt conectate. Aici termenul Restricted nu se referă la nicio comunicare intralayer. Fiecare nod prelucrează intrarea și ia decizia stocastică dacă transmite sau nu intrarea.

Exemple

Rolul important al RBM este distribuirea probabilităților. Limbile sunt unice prin litere și sunete. Distribuția probabilității scrisorii poate fi mare sau mică. În limba engleză, literele T, E și A sunt utilizate pe scară largă. Dar în islandeză, literele comune sunt A și N. nu putem încerca să reconstruim islandezul cu o greutate bazată pe engleză. Va duce la divergență.

Următorul exemplu sunt imaginile. Distribuția probabilității valorii lor de pixeli diferă pentru fiecare tip de imagine. Putem considera că există două imagini Elefant și Câine pentru nodurile de intrare remorcare, trecerea înainte a RBM va genera întrebări precum ar trebui să generez un nod puternic de pixel pentru nodul de elefant sau nodul de câine ?. Apoi, trecerea înapoi va genera întrebări precum elefantul, cum ar trebui să mă aștept la o distribuție de pixeli? Apoi, cu probabilitatea articulației și activarea produsă de noduri, vor construi o rețea cu co-apariția articulară ca urechi mari, tub ne-liniar gri, urechi floppy, rid este elefantul. Prin urmare, RBM este procesul de învățare profundă și vizualizare, ele formând două prejudecăți majore și acționează pe sensul lor de activare și reconstrucție.

Avantajele mașinii Boltzmann restrânse

  • Mașina Boltzmann restrânsă este algoritmul folosit pentru clasificare, regresie, modelare de subiecte, filtrare colaborativă și învățare de caracteristici.
  • Mașina Boltzmann restrânsă este utilizată pentru neuroimagistică, reconstrucție a imaginilor sparse în planificarea minelor și, de asemenea, în recunoașterea țintei radar
  • RBM capabil să rezolve problema dezechilibrată a datelor prin procedura SMOTE
  • RBM găsește valori lipsă prin eșantionarea lui Gibb care este aplicată pentru a acoperi valorile necunoscute
  • RBM învinge problema etichetelor zgomotoase prin date de etichetare necorectate și erori de reconstrucție a acestora
  • Problema datelor nestructurate este corectată de către extractorul care transformă datele brute în unități ascunse.

Concluzie

Învățarea profundă este foarte puternică, care este arta de a rezolva probleme complexe, este încă o cameră pentru îmbunătățiri și complexe de implementat. Variabilele gratuite trebuie configurate cu grijă. Ideile din spatele rețelei neuronale au fost dificile mai devreme, dar astăzi învățarea profundă este piciorul învățării automate și a inteligenței artificiale. Prin urmare, RBM oferă o privire a uriașilor algoritmi de învățare profundă. Se ocupă de unitatea de bază a compoziției care a devenit progresiv în multe arhitecturi populare și utilizate pe scară largă în multe industrii de scară largă.

Articol recomandat

Acesta a fost un ghid pentru mașina Boltzmann restricționată. Aici vom discuta despre funcționarea, eșantionarea, avantajele și Straturile mașinii Boltzmann restrânse. Puteți parcurge și alte articole sugerate pentru a afla mai multe _

  1. Algoritmi de învățare a mașinilor
  2. Arhitectura de învățare a mașinilor
  3. Tipuri de învățare automată
  4. Instrumente de învățare a mașinilor
  5. Implementarea rețelelor neuronale

Categorie: