Introducere în regresia polinomială

Regresia este definită ca metoda de a găsi relația dintre variabilele independente și dependente pentru a prezice rezultatul. Primul model de regresie polinomială a fost folosit în 1815 de Gergonne. Este utilizat pentru a găsi linia cea mai potrivită folosind linia de regresie pentru a prezice rezultatele. Există multe tipuri de tehnici de regresie, regresia polinomială este una dintre ele. Înainte de a înțelege acest lucru, este recomandabil să aveți cunoștințe adecvate de regresie liniară, astfel încât va fi ușor să marcați diferențele dintre ele.

De ce regresia polinomială?

  • Aceasta este una din tehnica de regresie folosită de către profesioniști pentru a prezice rezultatul. Este definit ca relația dintre variabilele independente și dependente atunci când variabila dependentă este legată de variabila independentă cu un al nouălea grad. Nu este necesar ca relația dintre variabilele dependente și independente să fie liniară, deci dacă linia este o curbă decât poate avea un termen polinomial.
  • Principala diferență între regresia liniară și cea polinomială este că regresia liniară necesită ca variabilele dependente și independente să fie înrudite liniar, în timp ce aceasta poate să se potrivească mai bine liniei dacă includem un grad mai mare la termenul variabil independent în ecuație. Ecuația regresiei polinomiale cu un al nouălea grad poate fi scrisă ca:

Y = b0 + a1x + a2x 2 + a3x 3 +…. ANX n

  • Dacă adăugăm grade mai mari, cum ar fi cvadratic, atunci transformă linia într-o curbă care se potrivește mai bine datelor. În general, este utilizat atunci când punctele din setul de date sunt împrăștiate și modelul liniar nu este capabil să descrie clar rezultatul. Ar trebui să fim mereu cu ochii pe Suprafăcarea și montarea în timp ce luăm în considerare aceste grade la ecuație.
  • Este mai bine să luați în considerare gradul care trece prin toate punctele de date, dar uneori, ia un grad mai mare, cum ar fi 10 sau 20, poate trece prin toate punctele de date și poate reduce eroarea, dar captează, de asemenea, zgomotul datelor care se potrivește modelului și poate fi evitat prin adăugarea mai multor probe la setul de date de instruire. Deci, este întotdeauna recomandabil să alegeți un grad optim pentru a se potrivi modelului.

Există două tehnici care sunt utilizate pentru a decide gradul ecuației:

  • Selecția înainte: este metoda de creștere a gradului până când este suficient de semnificativ pentru a defini modelul.
  • Selecție înapoi: este metoda de scădere a gradului până când este suficient de semnificativă pentru a defini modelul.

Procedura de aplicare a regresiei polinomiale

Găsiți pașii de mai jos sau procedura pentru a aplica regresia polinomială la orice set de date:

Pasul 1: Importați setul de date respectiv în orice platformă (R sau Python) și instalați pachetele necesare pentru aplicarea modelului.

Pasul 2: Împărțiți setul de date în seturi de instruire și testare, astfel încât să putem aplica algoritmul la setul de date de instruire și să îl testăm folosind setul de date de testare.

Pasul 3: Aplicați metode de analiză a datelor exploratorii pentru a studia fundalul datelor cum ar fi media, mediana, modul, primul quartil, al doilea quartile etc.

Pasul 4: Aplicați algoritmul de regresie liniară asupra setului de date și studiați modelul.

Pasul 5: Aplicați algoritmul de regresie polinomială la setul de date și studiați modelul pentru a compara rezultatele fie RMSE sau pătrat R între regresia liniară și regresia polinomială.

Pasul 6: vizualizați și previzionați atât rezultatele regresiei liniare cât și cele polinomiale și identificați care model prezice setul de date cu rezultate mai bune.

Utilizări de regresie polinomială

  • Este utilizat în multe proceduri experimentale pentru a produce rezultatul folosind această ecuație.
  • Oferă o relație excelentă definită între variabilele independente și dependente.
  • Este folosit pentru a studia izotopii sedimentelor.
  • Este utilizat pentru a studia creșterea diferitelor boli în cadrul oricărei populații.
  • Este utilizat pentru a studia generarea oricărei sinteze.

Caracteristici ale regresiei polinomiale

  • Este un tip de metoda de regresie neliniară care ne spune relația dintre variabila independentă și dependentă atunci când variabila dependentă este legată de variabila independentă a celui de-al nouălea grad.
  • Cea mai bună linie de încadrare este decisă de gradul ecuației de regresie polinomială.
  • Modelul derivat din regresia polinomială este afectat de valorile exterioare, astfel încât este întotdeauna mai bine să se trateze valorile exterioare înainte de aplicarea algoritmului la setul de date.
  • Funcția polinomialfeature () se transformă într-o caracteristică a matricei în funcție de gradul ecuației.
  • Natura curbei poate fi studiată sau vizualizată folosind o diagramă de dispersie simplă, care vă va oferi o idee mai bună despre relația de liniaritate dintre variabile și decide în consecință.

Concluzie

Regresia polinomială este utilizată în multe organizații atunci când identifică o relație neliniară între variabilele independente și dependente. Este una dintre tehnicile de regresie dificilă în comparație cu alte metode de regresie, astfel încât cunoașterea aprofundată despre abordare și algoritm vă va ajuta să obțineți rezultate mai bune.

Articole recomandate

Acesta este un ghid pentru o regresie polinomială. Aici discutăm caracteristicile și utilizările regresiei polinomiale. Puteți parcurge și alte articole sugerate pentru a afla mai multe -

  1. Algoritmul SVM
  2. Metode de kernel
  3. Funcția LINEST Excel
  4. Algoritmi de învățare a mașinilor
  5. Regresia liniară vs regresia logistică | Diferențe de top

Categorie: