대응표본 평균검정 ( paired-samples t test )
* 독립표본 평균검정은 두 개의 표본이 서로 독립인 모집단으로부터 추출되었다는 가정을 전제로함
* 두 표본의 값이 쌍(pair)을 이루고 있는 경우에 쌍을 이룬 값은 서로 독립이 아니며, 이처럼 검정하려고 하는 두 개의 표본이 서로 독립이 아닌 모집단으로부터 추출되었을 때 대응표본 평균검정을 이용하여 두 집단 간의 차이를 검정
독립표본 vs 대응표본
- 독립표본 실험
- 무작위로 실험 대상자를 선정하여 두 개의 집단으로 나눈다
- 한 집단에는 아침식사를 하고 IQ 테스트에 응하도록 하고, 다른 집단에는 아침식사를 거르고 IQ 테스트에 참가하도록 합니다.
- 각 실험 다상자에 대해 하나씩의 IQ 테스트 점수를 얻게 됩니다.
- 대응표본 실험
- 무작위로 실험 대상자를 선정
- 각 실험 대상자를 대상으로 IQ 테스트를 두 차례 실시합니다.
- 한 번은 아침식사를 하고 테스트에 응하도록 하고, 다른 한 번은 아침식사를 하지 않은 상태에서 테스트에 참가하도록 합니다.
- 각 실험 대상자에 대해 두 개의 IQ 테스트 점수를 얻게 됩니다.
R 프로그래밍 실습
sleep 데이터셋을 사용합니다.
10명의 사람들이 2종류의 수면제를 복용했을 때 ( group 1, 2 수면제 종류 ) 수면 시간의 차이에 대해(extra) 나타낸 데이터입니다.
한 사람이 두 종류의 약을 복용한 데이터 두 개가 나오므로 한 쌍(pair)의 데이터라고 할 수 있습니다.
> str(sleep)
'data.frame': 20 obs. of 3 variables:
$ extra: num 0.7 -1.6 -0.2 -1.2 -0.1 3.4 3.7 0.8 0 2 ...
$ group: Factor w/ 2 levels "1","2": 1 1 1 1 1 1 1 1 1 1 ...
$ ID : Factor w/ 10 levels "1","2","3","4",..: 1 2 3 4 5 6 7 8 9 10 ...
> sleep
extra group ID
1 0.7 1 1
2 -1.6 1 2
3 -0.2 1 3
4 -1.2 1 4
5 -0.1 1 5
6 3.4 1 6
7 3.7 1 7
8 0.8 1 8
9 0.0 1 9
10 2.0 1 10
11 1.9 2 1
12 0.8 2 2
13 1.1 2 3
14 0.1 2 4
15 -0.1 2 5
16 4.4 2 6
17 5.5 2 7
18 1.6 2 8
19 4.6 2 9
20 3.4 2 10
귀무가설은 수면제에 따라서 수면 시간은 차이가 없다.
대립가설은 수면제에 따라서 수면 시간에 차이가 있다.
이렇게 나눠집니다.
t.test() 함수를 동일하게 사용합니다.
formula 함수에는 종속변수와 독립변수를 지정하고 , data 파라미터에는 우리가 사용할 sleep 데이터를 적용합니다.
paired = TRUE 옵션은 데이터를 한 쌍으로 받도록 하여 대응표본 평균 검정을 실시할 수 있습니다.
t.test(extra ~ group, data = sleep, paired=TRUE)
> t.test(extra ~ group, data = sleep, paired=TRUE)
Paired t-test
data: extra by group
t = -4.0621, df = 9, p-value = 0.002833
alternative hypothesis: true mean difference is not equal to 0
95 percent confidence interval:
-2.4598858 -0.7001142
sample estimates:
mean difference
-1.58
결과를 보면 독립표본 평균검정과 달리 두 집단의 평균을 볼 수 없습니다.
대신 두 측정값의 쌍훈련 차이를 보여줍니다.
p-value를 보면 0.002833 으로써 유의수준 0.05에 못미치므로 귀무가설은 기각할 수 있습니다.
반응형