Regresie multivariată - Exemple de regresie multivariată

Cuprins:

Anonim

Introducere în regresia multivariată

  • Termenul în multivariate înseamnă model cu mai mult de o variabilă
  • Regresia multivariată este o parte a statisticilor multivariate.
  • Regresia multivariată este o tehnică folosită pentru a estima un model de regresie unică atunci când există mai mult de o variabilă de rezultat.
  • Regresia multivariată a utilizat în mod obișnuit un algoritm de învățare automată care este un algoritm de învățare supravegheată.

De ce modelul de regresie unică nu va funcționa?

  • Se știe că analiza de regresie este utilizată în principal pentru a explora relația dintre o variabilă dependentă și independentă.
  • În lumea reală, există multe situații în care multe variabile independente sunt influențate de alte variabile, pentru că trebuie să trecem la opțiuni diferite decât la un model de regresie unică care poate lua doar o singură variabilă independentă.

Ce este regresia multivariată?

  • Regresia multivariată ajută la utilizarea pentru a măsura unghiul mai multor variabile independente și a mai multor variabile dependente. Găsește relația dintre variabile (liniar legate).
  • Acesta a folosit pentru a prezice comportamentul variabilei de rezultat și asocierea variabilelor predictoare și modul în care variabilele predictoare se schimbă.
  • Poate fi aplicat în mai multe domenii practice precum politică, economie, medical, lucrări de cercetare și multe tipuri diferite de afaceri.
  • Regresia multivariată este o extensie simplă a regresiei multiple.
  • Regresia multiplă este utilizată pentru a prezice și schimba valorile unei variabile bazate pe valoarea colectivă a mai multor valori ale variabilelor predictoare.
  • În primul rând, vom lua un exemplu pentru a înțelege utilizarea regresiei multivariate după aceea vom căuta soluția la această problemă.

Exemple de regresie multivariată

  • Dacă Compania de comerț electronic a colectat datele clienților săi, cum ar fi Vârsta, istoricul achiziționat al unui client, genul și compania doresc să găsească relația dintre acești dependenți diferiți și variabile independente.
  • Un antrenor de gimnastică a colectat datele clientului său care vin la sala de sport și doresc să observe unele lucruri ale clientului care sunt sănătatea, obiceiurile alimentare (ce fel de client consumă în fiecare săptămână), greutatea clientului. Aceasta dorește să găsească o relație între aceste variabile.

După cum ați văzut în cele două exemple de mai sus, că în ambele situații există mai mult de o variabilă, unele sunt dependente și altele sunt independente, astfel încât regresul unic nu este suficient pentru a analiza acest tip de date.

Iată regresia multivariată care apare în imagine.

1. Selectarea caracteristicilor -

Selecția de caracteristici joacă cel mai important rol în regresia multivariată.

Găsirea funcției care este necesară pentru a găsi ce variabilă depinde de această caracteristică.

2. Normalizarea caracteristicilor -

Pentru o analiză mai bună, trebuie să fie dimensionate caracteristicile pentru a le pune într-un interval specific. Putem schimba și valoarea fiecărei caracteristici.

3. Selectați funcția Pierdere și Ipoteză -

Funcția de pierdere calculează pierderea atunci când ipoteza prezice valoarea greșită.

Iar ipoteza înseamnă valoarea prevăzută din variabila caracteristică.

4. Setați parametrii de ipoteză -

Setați parametrul ipotezei care poate reduce funcția de pierdere și poate prezice.

5. Minimizați funcția de pierdere-

Minimizarea pierderii prin utilizarea unui algoritm de minimizare a pierderilor și utilizarea acesteia peste setul de date care poate ajuta la ajustarea parametrilor ipotezei. Odată ce pierderea este minimizată, atunci poate fi utilizată pentru predicție.

Există mulți algoritmi care pot fi folosiți pentru reducerea pierderii, cum ar fi descendența în gradient.

6. Testați funcția ipotezei -

Verificați funcția ipotezei cu privire la corectarea valorilor de predicție, testați-o pe datele de testare.

Pași pentru a urma arhiva Multivariate Regression

1) Importați bibliotecile comune necesare, cum ar fi numpy, panda

2) Citiți setul de date utilizând biblioteca panda

3) După cum am discutat mai sus, trebuie să normalizăm datele pentru a obține rezultate mai bune. De ce normalizarea, deoarece fiecare caracteristică are o gamă diferită de valori.

4) Creați un model care poate arhiva regresia dacă utilizați ecuația de regresie liniară

Y = mx + c

În care x este dată intrarea, m este o linie înclinată, c este constantă, y este variabila de ieșire.

5) Antrenează modelul folosind hiperparametru. Înțelegeți hiperrametrul setat în funcție de model. Cum ar fi rata de învățare, epoci, iterații.

6) După cum s-a discutat mai sus despre modul în care ipoteza joacă un rol important în analiză, verifică ipoteza și măsoară funcția pierdere / cost.

7) Funcția pierdere / cost ne va ajuta să măsurăm modul în care valoarea ipotezei este adevărată și exactă.

8) Minimizarea funcției pierderi / costuri va ajuta modelul să îmbunătățească predicția.

9) Ecuația pierderii poate fi definită ca o sumă a diferenței pătrate între valoarea prevăzută și valoarea reală împărțită la două ori dimensiunea setului de date.

10) Pentru a reduce la minimum funcția Pierdere / Cost descendența gradientului, începe cu o valoare aleatorie și găsește punctul în care funcția lor de pierdere este cea mai mică.

Urmărind cele de mai sus, putem implementa regresia Multivariate

Avantajele regresiei multivariate

  • Tehnica multivariată permite găsirea unei relații între variabile sau caracteristici
  • Ajută la găsirea unei corelații între variabilele independente și dependente.

Avantaje ale regresiei multivariate

  • Tehnicile multivariate sunt un calcul matematic puțin complex și la nivel înalt
  • Ieșirea modelului de regresie multivariată nu este ușor de interpretat și uneori, deoarece unele pierderi și erori de ieșire nu sunt identice.
  • Nu poate fi aplicat unui set de date mic, deoarece rezultatele sunt mai simple în seturile de date mai mari.

Concluzie - Regresie multivariată

  • Scopul principal al utilizării regresiei multivariate este atunci când aveți mai multe variabile disponibile și în acest caz, regresia liniară unică nu va funcționa.
  • În principal, lumea reală are mai multe variabile sau caracteristici atunci când mai multe variabile / caracteristici intră în joc regresia multivariată sunt utilizate.

Articole recomandate

Acesta este un ghid al regresiei multivariate. Aici discutăm Introducerea, Exemple de regresie multivariată împreună cu Avantajele și Avantajele Dis. Puteți parcurge și alte articole sugerate pentru a afla mai multe -

  1. Formula de regresie
  2. Curs de știință a datelor la Londra
  3. Operatori SAS
  4. Tehnici de știință a datelor
  5. Variabile în JavaScript
  6. Cele mai importante diferențe de regresie față de clasificare