Stats & AI tech blog - '일단 시도함'
[통계] Survival Analysis (2) - Kaplan-Meier 생존곡선과 로그순위검정 본문
[통계] Survival Analysis (2) - Kaplan-Meier 생존곡선과 로그순위검정
justdoit ok? 2024. 3. 21. 11:24
1. Kaplan-Meier 생존곡선
Kaplan-Meier Estimation을 통해 시간에 따른 생존률을 확인할 수 있다. 집단 간 생존곡선을 비교하기에 용이하다.
추정 방법은 아래 순서로 진행된다.
- 자료를 관찰기간 순서대로 정렬한다.
- 사건이 발생한 시점의 구간생존률 $\hat{P}(t)$를 구한다.
$$\hat{P}(t) = \frac{t시점에서의 생존자 수}{t시점까지의 관찰대상자 수}$$ - 구간생존률로부터 누적생존률 $\hat{S}(t)$를 구한다.
$$\hat{S}(t) = \hat{S}(t-1) \times \hat{P}(t)$$
* 누적생존률 $\hat{S}(t)$를 구하는데는 조건부확률 개념이 들어간다.
예를 들어, 여섯번째 시점에서의 누적생존률 $\hat{S}(T=6)$은
$$\hat{S}(T=6) = P(T>6|T\geq 6) = \frac{P(T>6)\times P(T\geq 6|T>6)}{P(T\geq 6)} = \frac{P(T>6)}{P(T\geq 6)}$$
아래와 같은 생존곡선을 R survminer 패키지의 ggsurvplot() 함수를 통해 그릴 수 있다.
2. 로그순위검정 (Log-rank test)
로그순위검정은 2개 이상의 생존곡선이 통계적으로 동등한지 검정하는 방법이다.
각각의 시간에서 두 군의 기대값과 관찰값의 차이를 구하여 검정통계량을 계산하는 카이제곱검정의 일종으로 볼 수 있다.
로그순위검정은 R survminer 패키지의 survfit함수를 통해 구할 수 있다.
- 로그순위검정 대안
가중치를 주어 통계량을 계산하는 Wilcoxon, Tarone-Ware, Peto, Flemington-Harrington검정 등이 있다.
두 그룹간 차이가 초기 생존에서 크다면, 초기 생존시간에 가중치를 주는 방식으로 비교할 수 있다.
- 층화된 로그순위검정
두 군간 생존곡선을 비교할 때 공변량을 고려해야하는 경우가 있다. 이런 경우 층화된 비례위험모형을 사용하기도 하지만 공변량의 수준이 적을 때는 층화된 로그순위검정을 사용할 수도 있다.
* 생존 분석이란?
2024.03.21 - [Statistics] - [통계] Survival Analysis (생존 분석) (1)
* Cox 비례위험모형
2024.03.21 - [Statistics] - [통계] Cox Proportional Hazards Model (콕스비례위험모형)
* 생존 분석 with R
2024.03.27 - [Programming/R] - [R] Survival Analysis (Kaplan-Meier, Log-rank, Cox PH)
'Statistics & AI > Survival Analysis' 카테고리의 다른 글
[통계] Survival Analysis (3) - Cox Proportional Hazards Model (콕스비례위험모형) (0) | 2024.03.21 |
---|---|
[통계] Survival Analysis (1) (0) | 2024.03.21 |