[통계학] - 생존분석 - 카플란 마이어 분석 ( Kaplan-Meier analysis) , 생존확률, 생존함수곡선

카플란 마이어 분석 개요

카플란-마이어분석(Kaplan-Meier analysis)은 관측된 생존시간으로부터 생존확률을 추정합니다.

S(t)=i:tit(1dini)=P1+P2+...+Pt1=S^(t1)×Pt

p1은 첫 번째 구간을 지나 생존한 비율입니다. t개의 구간에서 구한 생존비율들을 누적생존비율(cumulative proportion survivng)이라고 합니다.

pi=1dini,i=1,2,...,t

여기에서,

  • S(t)t시점에서의 생존확률 추정치
  • pii 시점에서의 생존비율
  • dii시점에서의 사망자 수
  • nii시점에서의 생존자수

Screenshot from 2023-08-16 08-41-11

생존함수곡선

시간의 흐름에 따라 누적생존비율(즉 생존함수)이 변해가는 추세는 생존함수곡선(survival function curve)을 통해 시각적으로 확인할 수 있습니다. 위의 그림을 생존함수 곡선으로 표현하면 아래와 같습니다.

Screenshot from 2023-08-16 08-43-57

집단 간 생존함수 비교

로그순위검정(log rank test) 은 '모든 시점에서 집단 간에 생존시간의 차이가 없다'는 귀무가설을 통계적으로 검정합니다.
χ2logrank=(O1E1)2E1+(O2E2)2E2 여기에서, χ2logrank는 로그순위 검정통계량(<집단개수-1>을 자유도로 갖는 χ2 분포를 따름 ), O1,O2는 집단1과 집단2의 사망 관측빈도, E1,E2는 집단1과 집단2의 사망 기대빈도

E1=dini / E2=din2i

  • 여기에서 E1E2는 집단1과 집단2의 사망 기대빈도
  • dii 시점에서의 사망자 수
  • n1in2ii 시점에서의 집단1과 집단2의 생존자 수
  • nii 시점에서의 전체 생존자 수

Screenshot from 2023-08-16 09-01-10

사건발생 기대빈도는 각 사건발생 시점에서의 개별 사건발생 기대빈도를 계산하고 이를 모두 합산합니다.
개별 사건발생 기대빈도는 각 사건발생 시점의 사망률에 집단의 생존자수를 곱해서 계산할 수 있습니다.
각 사건발생 시점에서의 사망률은 집단 구분없이 전체 사망자수를 생존자수로 나눠서 계산합니다.
귀무가설이 사실이라면 이 비율은 두 집단 모두에게 동일하게 적용되어야 하므로 이렇게 계산한 사망률을 집단별 생존자수에 곱하여 집단별 기대빈도를 계산할 수 있습니다.

예를 들어 1일차의 시작시점에는 15명의 생존자가 있습니다. 같은 날 사망자수는 2명이고 사망률은 2/15 = 0.133입니다.
15명의 환자 가운데 치료제2를 처방받은 환자는 8명이므로 사망자의 기대빈도는 8 x 0.133인 1.07이 됩니다.

정리

의료 분야에서는 특정 치료 방법 혹은 수술 방법이 환자의 생존 기간에 영향을 미치는 지 확인하기 위해 Kaplan-Meier 곡선을 활용합니다. 따라서, 본 예제에서 진행한 것과 다르게 기존 치료 방법과 새로운 치료 방법을 동시에 나타내어 어떠한 치료 방법이 높은 생존율을 가지는지 비교하기 위해 Kaplan-Meier 곡선을 사용하기도 합니다.

반응형