Prezentare generală a ANOVA Two Way în R
În două moduri, ANOVA (Analiza Varianței) ne ajută să înțelegem relația dintre o variabilă dependentă continuă și două variabile independente categorice. În acest subiect, vom afla despre ANOVA cu două căi în R.
Mai jos se prezintă ipoteza de interes în cadrul ANOVA cu două sensuri
- H₀: Numiți-l efectul principal care este primul factor care este dependent de variabila continuă
- H₀: efectul principal este și efectul asupra celei de-a doua variabile asupra variabilei continue dependente.
- H₀: Interacțiunea este efectul combinat al primei variabile cu cel de-al doilea factor asupra variabilei dependente
Mai jos sunt prezentate normele pe care trebuie să le îndeplinească ANOVA cu două sensuri.
- Observațiile trebuie să fie independente
- Observațiile ar trebui să fie distribuite în mod normal.
- Ar trebui să existe o variație egală în observații
- Nu există valori superioare în proiectare
- Erorile ar trebui să fie independente.
Notă
Trebuie să ne transformăm datele dacă normalitatea și variația egală sunt încălcate.
Exemplu de ANOVA cu două căi în R
Haideți să efectuăm un test ANOVA într-un mod setat de date privind nivelurile de cancer care conține 48 de rânduri și 3 variabile de date:
Timpul luat: timpul de supraviețuire al unui animal
Niveluri diferite de cancer 1 - 3
Tratament: tratamente utilizate de la 1-3
Înainte de a testa, avem nevoie de următoarele date în mână.
- Importarea datelor
- Eliminați variabila inutilă
- Convertiți variabilele (nivelurile de Rac) ca nivel ordonat.
Mai jos este setul de date.
Observații: 48
Variabile: 3
timp pentru supraviețuire 0.31, 0.45, 0.46, 0.43, 0.36, 0.29, 0.40, 0.23, 0.22, 0 …
nivelurile de cancer 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 1, 1, 1, 1, 2, 2, 2 …
Tratamentul A, A, A, A, A, A, A, A, A, A, A, A, A, B, B, B, B, B, B, …
Obiective
- H₀: nicio schimbare în timpul mediu de supraviețuire între grup
- H₀: timpul de supraviețuire este diferit pentru cel puțin un grup.
paşi
- Verificați nivelul cancerului. Putem vedea trei valori ale caracterului, deoarece le transformăm în factori cu un verb mut.
levels(df$cancerlevels)
output: (1) "1" "2" "3"
- Calculați atât abaterea medie, cât și abaterea standard
df % > %
group_by(cancerlevels) % > %
summarise(
count_ cancerlevels = n(),
mean_time = mean(time, na.rm = TRUE),
sd_time = sd(time, na.rm = TRUE)
)
ieşire:
Un mormânt: 3 x 4
cancerlevels count_cancerlevels mean_time sd_time
1 1 16 0.617500 0.20942779
2 2 16 0, 544375 0, 28936641
3 3 16 0.276250 0.06227627
- În pasul trei, puteți verifica grafic dacă există o diferență între distribuții. Rețineți că includeți punctul jittered.
- Executați testul cu comanda AOV.
aov(formula, data)
Arguments:
- formula: The equation you want to estimate
- data: The dataset used
Sintaxă:
y ~ X1 + X2 + … + Xn (X1 + X2 + … se referă la variabilele independente)
y ~. Utilizați toate variabilele rămase ca variabile independente
Asigurați-vă că salvați modelul și imprimați rezumatul.
Cod
- aov (time ~ cancerlevels, data = df): Rulați testul ANOVA cu următoarea formulă
- rezumat (anova_one_way): imprimați rezumatul testului
Suma Df Sq Media Sq F Valoarea Pr (> F)
Cancerlevels 2 1.033 0.5165 11.79 7.66e-05 ***
Reziduuri 45 1.972 0, 0438
-
Semni. coduri: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0, 1 '' 1
Valoarea p este mai mică decât pragul 0, 05. Diferența statistică este indicată de „*” în cazul de mai sus.
Test One Way către Anova Două Căi în R
Să vedem cum se poate extinde testul unidirecțional la ANOVA cu două sensuri. Testul este similar cu ANOVA unidirecțional, dar formula diferă și adaugă o altă variabilă de grup la formulă.
y = x1 + x2
- H0 : Mijloacele sunt egale pentru ambele variabile (variabile factor)
- H3 : Mijloacele sunt diferite pentru ambele variabile
Adăugați variabile de tratament modelului nostru. Această variabilă indică tratamentul oferit pacientului. Vă interesează să vedeți dacă există o dependență statistică între nivelurile de cancer și tratamentul acordat pacientului.
Ne ajustăm codul adăugând un tratament cu cealaltă variabilă independentă.
Suma Df Sq Media Sq F Valoarea Pr (> F)
Niveluri de cancer 2 1.0330 0.5165 20.64 5.7e-07 ***
Tratarea 3 0, 9212 0, 3071 12, 27 6, 7e-06 ***
Reziduuri 42 1.0509 0.0250
Atât nivelul cancerului, cât și tratamentul sunt statistic diferite de 0. Prin aceasta, putem respinge ipoteza NULL. De asemenea, confirmați că schimbarea tratamentului sau a tipului de cancer afectează timpul supraviețuirii.
Test
ANOVA unidirecțional: H3- Media este diferită pentru cel puțin un grup
ANOVA în două sensuri: H3- Media este diferită pentru ambele grupuri.
Diferența dintre un singur sens și ANOVA
Diferențele dintre ANOVA unidirecțional și ANOVA cu două sensuri
ANOVA unidirecțional | ANOVA cu două sensuri |
Proiectat pentru a permite testarea egalității între 3 sau mai multe mijloace | Proiectat pentru a evalua interrelația a două variabile independente pe o variabilă dependentă. |
Implică o variabilă independentă | Implică două variabile independente |
Analizat în 3 sau mai multe grupuri categorice. | Compara mai multe grupuri de doi factori |
Trebuie să satisfacă două principii: replicarea și randomizarea | Trebuie să satisfacă trei principii care sunt replicarea, randomizarea și controlul local. |
Avantajele ANOVA bidirecționale
- În exemplul de mai sus, vârsta și sexul din exemplul nostru - ajută la reducerea variației erorilor, făcând designul mai eficient.
- ANOVA cu două căi ne permite să testăm efectul a doi factori în același timp.
Aplicațiile ANOVA
- Compararea kilometrajului dintre diferite vehicule, combustibil și tipuri de drum.
- Cunoașterea impactului temperaturii, presiunii sau concentrației chimice asupra unor reacții chimice (reactoare electrice, centrale chimice etc.)
- Impactul diferiților catalizatori asupra vitezei de reacție chimică
- Înțelegerea impactului reclamelor și a unui număr diferit de răspunsuri ale clienților.
- Impactul performanței, calității și vitezei de fabricație în biologie (proces bazat pe numărul de celule în care sunt împărțite)
Articole recomandate
Acesta este un ghid al ANOVA cu două căi din R. Aici discutăm exemplele, obiectivele, etapele și diferența dintre ANOVA cu un sens și două sensuri. De asemenea, puteți arunca o privire la următoarele articole pentru a afla mai multe -
- ANOVA în R
- Cum se interpretează rezultatele folosind testul ANOVA
- Regresie vs ANOVA
- GLM în R