avo(formula, data=NULL, projections=FALSE, qr=TRUE,
contrasts=NULL, ...)
anova(object, ...)
avo(종속변수~그룹변수, data) 순서로 입력
summary() 함수를 이용해서 p-value를 출력
분산 분석(ANOVA, Analysis Of Variance)
세 개 이상의 모집단이 있을 경우 여러 집단 사이의 평균을 비교하는 검정 방법이다.
분산 분석의 귀무 가설(H0)은 항상 ‘집단 간의 평균의 차이는 같다’ 이다.
귀무 가설이 기각되어도, 어떤 집단 간의 평균이 같고 어느 집단 간의 평균이 얼마나 다른지 알 수 없다.
분산 분석은 귀무 가설을 기각한 이 후, 사후 검정 방법으로
Scheffe, Turkey, Duncan, Fisher’s LSD, Dunnett, Bonferroni 등의 방법이 사용됨
분산 분석의 데이터는 범주형 데이터이어야 하고, 종속변수는 연속형이어야 한다.
분산 분석에는 F-Value가 사용
1. 일원 분산 분석(one-way ANOVA)셋 이상의 집단 간의 평균을 비교하는 상황에서 하나의 집단에 속하는 독립변수와 종속변수 모두 한 개일 때 사용
ex) 연령별 유투브 시청 시간 차이
분산 분석표
요인 |
제곱합 |
자유도 |
제곱평균 |
F 비 |
처리 |
SSR |
a=집단수-1 |
MSR=SSR/a |
F=MSR/MSE |
잔차 |
SSE |
b=전체 데이터-집단수 |
MSE=SSE/b |
계 |
SST=SSR+SSE |
a+b(=전체 데이터-1) |
- |
- |
SSR(residual sum of squares): 잔차들이 자신의 표준평균으로부터 벗어난 편차의 제곱
SSE(explained sum of squareds): 표준평균과 종속변수 값 중 독립변수에 의해 설명된 부분과의 차이를
제곱하여 합한 값
SST(total sum of squared): 종속변수의 관측값과 표본의 평균의 차이(편차)를 제곱하여 합한 값
SST=SSR+SSE
> phoneSpeed<-runif(45, min=75, max=100)
> telecom<-rep(c('A', 'B', 'C'), 15)
> phoneData<-data.frame(phoneSpeed, telecom)
> result<-aov(data=phoneData, phoneSpeed~telecom)
> summary(result)
Df Sum Sq Mean Sq F value Pr(>F)
telecom 2 77 38.50 0.62 0.543
Residuals 42 2607 62.08
p-value 값이 0.543으로 0.05보다 작지 않기 때문에 귀무 가설을 기각할 수 없다.
세 대의 신형 핸드폰 간의 속도 차이는 없다고 할 수 있다.
2. 이원 분산 분석(two-away Anova)
일원 분산 분석 수행 시, 독립변수의 수가 2개 이상일 때 사용한다.
ex) 성별, 연령별 유투브 시청 시간 차이
이원 분산 분석은 독립 변수 간 교호 작용이 있다고 판단될 때, ‘반복이 있는 실험’을 하고,
교호 작용이 없다고 판단될 때(두 독립 변수가 독립인 경우) ‘반복이 없는 실험’을 한다.
교호 작용: 독립 변수끼리 서로 영향을 미치는 경우
집단 간의 평균 차이를 검증할 때, 종속 변수가 2개 이상이면 ‘다변량 분산 분석(Manova)’를 수행
교호작용이 있을 때-반복이 있는 이원분산 분석표(p, q는 집단의 수, r은 반복회수)
요인 |
제곱 합 |
자유도 |
제곱 평균 |
F |
A |
SSA |
p-1 |
MSA=SSA/p-1 |
MSA/MSE |
B |
SSB |
pq-1 |
MSB=SSB/q-1 |
MSB/MSE |
A*B |
SSAB |
(p-1)(q-1) |
MSAB=SSAB/(p-1)(q-1) |
MSAB/MSE |
오차 |
SSE |
pq(r-1) |
MSE=SSE/pq(r-1) |
|
총 |
SST |
pqr-1 |
|
|
교호작용이 없을 때-반복이 없는 이원분석분석표(p, q는 집단의 수)
요인 |
제곱 합 |
자유도 |
제곱 평균 |
F |
A |
SSA |
p-1 |
MSA=SSA/p-1 |
MSA/MSE |
B |
SSB |
q-1 |
MSB=SSB/q-1 |
MSB/MSE |
오차 |
SSE |
(p-1)(q-1) |
MSE=SSE/(p-1)(q-1) |
|
총 |
SST |
pq-1 |
|
|