[R] 통계데이터 분석 - 분산분석 - 분산분석 설계 ( ANOVA )

분산분석 ( analysis of variance , ANOVA )

여러 모집단 간의 평균의 동일성을 검정

t검정을 이용한 평균검정을 수행하면 두 개의 표본을 바탕으로 각각 대응되는 두 개의 모집단의 평균이 서로 동일한지 검증할 수 있습니다.
다시말해 두 집단이 있을 때, 두 집단의 평균값이 같은지 검증할 수 있습니다. 하지만 t 검정을 이용해서 두 집단을 초과하는 집단의 평균값을 비교할 수는 없습니다. ( ex. 3개의 집단 )

오늘 다루게 될 분산분석은 여러 모집단 간의 평균의 동일성을 검증합니다.

  • 일원분산분석(one-way ANOVA)
  • 이원분산분석(two-way ANOVA)
  • 공분산분석(analysis of covariance, ANCOVA)
  • 반복측정 분산분석(repeated measures ANOVA)
  • 다변량 분산분석(multivariate analysis of variance, MANOVA)
  • 다변량 공분산분석(multivariate analysis of covariance, MANCOVA)

일원분산분석 (one-way ANOVA)

ADHD(attention deficit hyperactivity disorder, 주의력 결핍-과잉행동장애)에 대한 두 가지 심리치료 방법을 비교하는 실험을 예로 들겠습니다.

아래의 예시는 집단 간 일원분산분석입니다. 집단을 구분하는 범주형 변수(심리치료 A,B)는 한 개이며 각 실험 참여자는 범주형 변수에 의해 구분되는 두 집단 가운데 하나에만 할당됩니다.

분산분석의 가설검정은 일반적으로 F-검정을 통해 이루어집니다. F-검정 결과가 통계적으로 유의하다면 두 심리치료방법에 따른 효과는 다르다고 결론을 내릴 수 있습니다.

스크린샷 2023-07-31 오후 3 20 51

만약 심리치료 후 일정 기간 이후에 나타나는 변화에 관심이 있다면 다른 방법을 사용할 수 있습니다.
아래의 예시는 집단 내 일원분산분석입니다. 집단을 구분하는 범주형 변수(기간)는 한 개이며 각 실험 참여자는 범주형 변수에 의해 구분되는 두 집단 모두에 할당됩니다.

10명의 모든 참여자에게 4주 동안의 심리치료A를 처치하고 ADHD 평가점수를 기재합니다. 그리고 16주 후에 다시 ADHD 점수를 측정해서 기록합니다.
이러한 방식으로 설계된 분산분석을 집단 내 일원분산분석이라고 합니다.

스크린샷 2023-07-31 오후 3 24 52

이원분산분석(two-way ANOVA)

이원분산분석은 집단을 구분하는 범주형 변수(심리치료, 기간)는 두 개이며 각각 집단 간 요인과 집단 내 요인을 나타냅니다.

  • 주효과(main effect): 심리치료 방법의 영향, 기간의 영향
  • 상호작용효과(Interaction effect) : 심리치료 방법과 기간 간 상호작용의 영향
스크린샷 2023-07-31 오후 3 28 50

공분산분석(analysis of covariance, ANCOVA)

위의 실험에서 실험 참가자가 보유하고 있는 스트레스 수준은 각각 다를 것입니다. 그래서 분산분석의 결과에 의해서 심리치료 방법에 따라서 ADHD 치료의 효과에 차이가 있다라는 결론을 얻었을 때, 그 ADHD의 치료효과 차이가 심리치료 방법 뿐만 아니라 실험 참여자의 스트레스 수준에 영향을 받았을지도 모릅니다. 실험 참여자의 스트레스 수준을 사전에 조사하여 그 데이터를 보유하고 있다면 실험 참여자의 스트레스 수준을 통제해서 심리치료 방법에 따른 순수한 차이를 검정할 수 있습니다. 이 때 이 스트레스 변수를 공변량이라고 합니다. 그리고 이러한 실험설계를 공분산 분석이라고 합니다.


공분산분석의 장점은 공변량(covariate)을 통제하여 독립변수의 순수한 영향을 검정할 수 있다는 것입니다.

  • 다변량 분산분석 : 두 개 이상의 종속변수를 포함

  • 다변량 공분산분석 : 두 개 이상의 종속변수와 공변량 포함

반응형