Formula Outliers (cuprins)

  • Outliers Formula
  • Exemple de formulă Outliers (cu șablon Excel)

Outliers Formula

În statistici, Outliers sunt cele două puncte neobișnuite distanțate extrem de mult în seturile de date date. Valorile extrem de ridicate și valorile extrem de mici sunt valorile anterioare ale unui set de date. Acest lucru este foarte util pentru a găsi orice defect sau greșeală care a avut loc. La fel cum spune și numele, Outliers sunt valori care se găsesc în afara restului de valori din setul de date. De exemplu, luați în considerare studenții de inginerie și imaginați-vă că au pitici în clasa lor. Deci piticii sunt oamenii care au o înălțime extrem de mică în comparație cu alți oameni cu înălțime normală. Deci aceasta este valoarea anterioară din această clasă. Valorile anterioare pot fi calculate folosind metoda Tukey.

Formula pentru Outliers -

Lower Outlier = Q1 – (1.5 * IQR)
Higher Outlier= Q3 + (1.5 * IQR)

Exemple de formulă Outliers (cu șablon Excel)

Să luăm un exemplu pentru a înțelege calculul formulei Outliers într-o manieră mai bună.

Puteți descărca acest șablon Outliers aici - Modelul Outliers

Formula Outliers - Exemplul # 1

Luați în considerare următorul set de date și calculați valorile pentru setul de date.

Set de date = 5, 2, 7, 98, 309, 45, 34, 6, 56, 89, 23

Ordine crescândă a setului de date:

Valoarea mediană a setului de date ascendente este calculată ca:

În acest set de date, numărul total de date este 11. Deci n = 11. Median = 11 + 1/2 = 12/2 = 6. Prin urmare, valoarea care este în a 6- a poziție în acest set de date este mediana.

Deci valoarea medie = 34.

Împărțiți setul de date în 2 reprize folosind mediana.

Mediana setului de date pentru jumătatea inferioară și jumătatea superioară este calculată ca:

  • În jumătatea inferioară 2, 5, 6, 7, 23, dacă găsim mediana ca și cum am găsit la pasul 2, valoarea mediană ar fi 6. Deci Q1 = 6.
  • În jumătatea superioară 45, 56, 89, 98, 309 dacă găsim mediana ca și cum am găsit la pasul 2, valoarea mediană ar fi 89. Deci Q3 = 89.

IQR este calculat folosind formula prezentată mai jos

IQR = Q3 - Q1

  • IQR = 89 -6
  • IQR = 83

Lower Outlier este calculat folosind formula prezentată mai jos

Inferior mai mic = Q1 - (1, 5 * IQR)

  • Inferior mai mic = 6 - (1, 5 * 83)
  • Outlier inferior = -118, 5

Mai mare Outlier este calculat folosind formula prezentată mai jos

Mai mare în avans = T3 + (1, 5 * IQR)

  • Mai mare din exterior = 89 + (1, 5 * 83)
  • Mai mare în avans = 213, 5

Obțineți acum aceste valori în setul de date -118.5, 2, 5, 6, 7, 23, 34, 45, 56, 89, 98, 213.5, 309. Valori care se situează sub valoarea inferioară și mai sus în partea superioară sunt valoarea anterioară. Pentru acest set de date, 309 este anterior.

Formula Outliers - Exemplul # 2

Luați în considerare următorul set de date și calculați valorile pentru setul de date.

Set de date = 45, 21, 34, 90, 109.

Ordine crescândă a setului de date:

Valoarea mediană a setului de date ascendente este calculată ca:

În acest set de date, numărul total de date este 5. Deci n = 5. Median = 5 + 1/2 = 6/2 = 3. Prin urmare, valoarea care este pe a 3-a poziție în acest set de date este mediana.

Deci valoarea medie = 45.

Împărțiți setul de date în 2 reprize folosind mediana.

Mediana setului de date pentru jumătatea inferioară și jumătatea superioară este calculată ca:

  • Q1 = 27, 5
  • Q3 = 89

IQR este calculat folosind formula prezentată mai jos

IQR = Q3 - Q1

  • IQR = 99, 5 - 27, 5
  • IQR = 72

Lower Outlier este calculat folosind formula prezentată mai jos

Inferior mai mic = Q1 - (1, 5 * IQR)

  • Inferior mai mic = 27, 5 - (1, 5 * 72)
  • Outlier inferior = -80, 5

Mai mare Outlier este calculat folosind formula prezentată mai jos

Mai mare în avans = T3 + (1, 5 * IQR)

  • Mai mare din exterior = 99, 5 + (1, 5 * 72)
  • Mai mare afară = 207, 5

Explicaţie

Pasul 1: Aranjați toate valorile din setul de date date în ordine crescătoare.

Pasul 2: Găsiți valoarea mediană pentru datele care sunt sortate. Median poate fi găsit folosind următoarea formulă. Următorul calcul vă oferă pur și simplu poziția valorii mediane care se află în data stabilită.

Mediană ((n + 1) / 2

În cazul în care n este numărul total de date disponibile în setul de date.

Pasul 3: Găsiți valoarea Qile inferioară Q1 din setul de date. Pentru a găsi acest lucru, folosind valoarea mediană împărțiți setul de date în două jumătăți. Din jumătatea inferioară a setului de valori, găsiți mediana pentru acel set inferior care este valoarea Q1.

Pasul 4: Găsiți valoarea Qile superioară Q3 din setul de date. Este exact ca la pasul de mai sus. În locul jumătății inferioare, trebuie să urmăm aceeași procedură setul de valori al jumătății superioare.

Pasul 5: Găsiți valoarea IQR a intervalului interquartile. Pentru a găsi valoarea Q1 Deduct din Q3.

IQR = Q3-Q1

Pasul 6: Găsiți valoarea Extremă interioară. Un capăt care se încadrează în partea inferioară, care poate fi, de asemenea, numit minor în exterior. Înmulțiți valoarea IQR cu 1, 5 și deduceți această valoare din Q1 vă oferă extrema inferioară interioară.

Inferior mai mic = Q1 - (1, 5 * IQR)

Pasul 7: Găsiți valoarea Outer Extreme. Un capăt care nu se încadrează în partea superioară, care poate fi numit și mai important. Înmulțiți valoarea IQR cu 1, 5 și sumați această valoare cu Q3 vă oferă extrema superioară.

Mai mare în avans = T3 + (1, 5 * IQR)

Pasul 8: Valorile care se încadrează în aceste extreme și exterioare sunt valorile exterioare pentru setul de date dat.

Relevanța și utilizările formulei Outliers

Outliers sunt foarte importanți în orice problemă de analiză a datelor. Anterior arată o inconsistență în orice set de date, întrucât este definit ca fiind valorile îndepărtate neobișnuite din setul de date de la unul la altul. Acest lucru este foarte util pentru a găsi orice defecte apărute în setul de date. Deoarece atunci când introduceți o eroare în setul de date, aceasta afectează media și, prin urmare, poate obține abateri mari în rezultat, dacă Outliers sunt în setul de date. Prin urmare, este esențial să aflăm Outliers din datele setate pentru a evita probleme grave în analiza statistică.

Articole recomandate

Acesta a fost un ghid pentru formula Outliers. Aici vom discuta despre cum să calculăm Outliers împreună cu exemple practice și șablon Excel descărcabil. De asemenea, puteți consulta următoarele articole pentru a afla mai multe -

  1. Ghidul formulei Midrange
  2. Exemple de formula salariala
  3. Calculator pentru formula DPMO
  4. Cum se calculează distribuția T?
  5. Formula de deviere a sferturilor | Exemple