[R] 대응표본 평균검정 (paired-samples t test)

반응형

대응표본 평균검정 ( paired-samples t test ) 

* 독립표본 평균검정은 두 개의 표본이 서로 독립인 모집단으로부터 추출되었다는 가정을 전제로함 

 

* 두 표본의 값이 쌍(pair)을 이루고 있는 경우에 쌍을 이룬 값은 서로 독립이 아니며, 이처럼 검정하려고 하는 두 개의 표본이 서로 독립이 아닌 모집단으로부터 추출되었을 때 대응표본 평균검정을 이용하여 두 집단 간의 차이를 검정 

 

독립표본 vs 대응표본 

 

  • 독립표본 실험
    • 무작위로 실험 대상자를 선정하여 두 개의 집단으로 나눈다
    • 한 집단에는 아침식사를 하고 IQ 테스트에 응하도록 하고, 다른 집단에는 아침식사를 거르고 IQ 테스트에 참가하도록 합니다. 
    • 각 실험 다상자에 대해 하나씩의 IQ 테스트 점수를 얻게 됩니다. 

 

  • 대응표본 실험
    • 무작위로 실험 대상자를 선정
    • 각 실험 대상자를 대상으로 IQ 테스트를 두 차례 실시합니다.
    • 한 번은 아침식사를 하고 테스트에 응하도록 하고, 다른 한 번은 아침식사를 하지 않은 상태에서 테스트에 참가하도록 합니다.
    • 각 실험 대상자에 대해 두 개의 IQ 테스트 점수를 얻게 됩니다. 

 


R 프로그래밍 실습 

 

sleep 데이터셋을 사용합니다. 

10명의 사람들이 2종류의 수면제를 복용했을 때 ( group 1, 2 수면제 종류 ) 수면 시간의 차이에 대해(extra) 나타낸 데이터입니다.  

한 사람이 두 종류의 약을 복용한 데이터 두 개가 나오므로 한 쌍(pair)의 데이터라고 할 수 있습니다. 

> str(sleep)
'data.frame':	20 obs. of  3 variables:
 $ extra: num  0.7 -1.6 -0.2 -1.2 -0.1 3.4 3.7 0.8 0 2 ...
 $ group: Factor w/ 2 levels "1","2": 1 1 1 1 1 1 1 1 1 1 ...
 $ ID   : Factor w/ 10 levels "1","2","3","4",..: 1 2 3 4 5 6 7 8 9 10 ...
> sleep
   extra group ID
1    0.7     1  1
2   -1.6     1  2
3   -0.2     1  3
4   -1.2     1  4
5   -0.1     1  5
6    3.4     1  6
7    3.7     1  7
8    0.8     1  8
9    0.0     1  9
10   2.0     1 10
11   1.9     2  1
12   0.8     2  2
13   1.1     2  3
14   0.1     2  4
15  -0.1     2  5
16   4.4     2  6
17   5.5     2  7
18   1.6     2  8
19   4.6     2  9
20   3.4     2 10

 

귀무가설은 수면제에 따라서 수면 시간은 차이가 없다. 

대립가설은 수면제에 따라서 수면 시간에 차이가 있다. 

이렇게 나눠집니다. 

 

t.test() 함수를 동일하게 사용합니다.

formula 함수에는 종속변수와 독립변수를 지정하고 , data 파라미터에는 우리가 사용할 sleep 데이터를 적용합니다. 

paired = TRUE 옵션은 데이터를 한 쌍으로 받도록 하여 대응표본 평균 검정을 실시할 수 있습니다.

t.test(extra ~ group, data = sleep, paired=TRUE)

> t.test(extra ~ group, data = sleep, paired=TRUE)

	Paired t-test

data:  extra by group
t = -4.0621, df = 9, p-value = 0.002833
alternative hypothesis: true mean difference is not equal to 0
95 percent confidence interval:
 -2.4598858 -0.7001142
sample estimates:
mean difference 
          -1.58

결과를 보면 독립표본 평균검정과 달리 두 집단의 평균을 볼 수 없습니다. 

대신 두 측정값의 쌍훈련 차이를 보여줍니다. 

p-value를 보면 0.002833 으로써 유의수준 0.05에 못미치므로 귀무가설은 기각할 수 있습니다.  

반응형