T-test(T-value)

t.test(x, y=NULL, alternative=c('two.sided', 'less', 'greater'), mu=0,
paired=FALSE, var.equal=FALSE, conf.level=0.95)
일 표본 t-검정(one sample t-test)
하나의 모집단 평균(n) 값을 특정값과 비교한느 경우 사용
    일 표본 단측 t-검점
> weights<-runif(10, min=49, max=52)
> t.test(weights, mu=50, alternative='greater’)    # 반대 방향은 ‘less’ 사용

One Sample t-test

data:  weights
t = 2.6957, df = 9, p-value = 0.01228

# 대립 가설: 지우개의 평균 중량은 50g 보다 크다.
alternative hypothesis: true mean is greater than 50
95 percent confidence interval:
 50.24982      Inf
sample estimates:
mean of x 
  50.7807 
검정 결과 검정 통계량 t=2.6957 이며, 자유도는 표본의 개수보다 1 적은 df=9 이다.
p-value가 유의 수준 0.05 보다 작으므로 귀무가설을 기각 가능
    일 표본 양측 t-검정

> weights<-runif(100, min=40, 100)

> t.test(weights, mu=70, alternative='two.sided')


One Sample t-test


data:  weights

t = 0.10914, df = 99, p-value = 0.9133

alternative hypothesis: true mean is not equal to 70

95 percent confidence interval:

 66.65786 73.73119

sample estimates:

mean of x 

 70.19452 

검정 통계량 t=0.10914 이며, 자유도는 n-1 df=99이다.
p-value가 유의수준 0.05보다 작지 않으므로 귀무가설을 기각할 수 없다.
이(독립) 표본 t-검정(independent sample t-test)
서로 독립적인 집단에 대하여 모수(모평균)의 값이 같은 값을 갖는지 통계적으로 검정
모집단 분산이 같음을 의미하는 등분산성을 만족해야 한다.
(t-검정을 수행하기 전에 등분산 검정(F 검정)을 먼저 수행해야 한다.)
    이 표본 단측 t-검정

> salaryA<-runif(100, min=250, max=380)

> salaryB<-runif(100, min=200, max=400)

> t.test(salaryA, salaryB, alternative='less')


Welch Two Sample t-test


data:  salaryA and salaryB

t = 2.8725, df = 167.26, p-value = 0.9977

alternative hypothesis: true difference in means is less than 0

95 percent confidence interval:

     -Inf 31.66742

sample estimates:

mean of x mean of y 

 318.3956  298.2997 

검정 통계량 t=2.8725이고, 자유도는 df=167.26이다.
p-valuesms 0.9977로 유의수준 0.05보다 크다(귀무가설을 기각할 수 없다.)

salaryA가 salaryB보다 같거나 많다고 말할 수 있다.
    이 표본 양측 t-검정
> speedK<-runif(100, min=30, max=40)
> speedL<-runif(100, min=25, max=35)
> t.test(speedK, speedL, alternative='two.sided')

Welch Two Sample t-test

data:  speedK and speedL
t = 14.151, df = 197.96, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 4.605020 6.096261
sample estimates:
mean of x mean of y 
 35.22861  29.87797 
p-value가 유의수준 0.05보다 작기 때문에 귀무가설을 기각할 수 있다.
대응 표본 t-검정(paired t-test)
동일한 대사에 대해 두 개의 관측치가 있는 경우 이를 비교하여 차이가 있는지 검정

가정
1. 관측치가 정규분포를 따라야 한다.
2. 표본 집단(condition)이 두 개여야 한다.
3. 독립변수가 하나여야 한다.(독립변수가 많아지면 Factorial ANOVA를 사용)
4. 두 집단이 독립적이지 않다.

> before<-runif(100, min=60, max=80)

> after<-before+rnorm(10, mean=-3, sd=2)

> t.test(before, after, alternative='greater', paired=TRUE)


Paired t-test


data:  before and after

t = 10.625, df = 99, p-value < 2.2e-16

alternative hypothesis: true difference in means is greater than 0

95 percent confidence interval:

 1.597857      Inf

sample estimates:

mean of the differences 

               1.893806 

p-value가 유의수준(0.05)보다 작기 때문에 귀무 가설을 기각할 수 있다.
(두 집단의 평균의 차이는 0보다 크다. 체중 감량 효과가 있다.)