Stats & AI tech blog - '일단 시도함'

[통계] IPTW, Inverse Probability of Treatment Weighting (역확률가중치) 본문

Statistics & AI/Propensity Score Analysis

[통계] IPTW, Inverse Probability of Treatment Weighting (역확률가중치)

justdoit ok? 2024. 11. 7. 10:25

성향점수분석 기법 중 하나인 처치역확률가중치(IPTW, Inverse Probability of Treatement Weighting)는 가중치를 부여하여 혼란 변수를 보정하는 기법이다. 성향점수매칭(PSM) 기법과 달리 매칭이 필요없으므로 데이터 손실 없이 전체 표본을 사용할 수 있다는 장점이 있다.

 

IPTW 계산은 아래 절차대로 수행된다.

 

1. 공변량 선정

2. 성향점수추정

3. 공통지지영역 점검

4. IPTW 계산

5. 공변량 균형성 점검

 

1. 공변량 선정

먼저 IPTW를 통해 보정할 공변량을 선정해야 한다.

보정이 필요한 공변량은 원인 배치 변수 또는 결과 변수와 관련된 변수가 되어야 한다.

 

예를 들어, 치료 여부(Treatment)가 완치 여부(Outcomes)에 미치는 영향을 파악하고자 하는 연구에서 성별은 치료 그룹 배치나 완치 여부에 영향을 줄 수 있기 때문에 치료-완치 간의 관계를 정확히 파악하는데 혼란 변수로 작용할 수 있다.

이런 경우 성별 변수를 IPTW 과정에 공변량으로 선정하여 보정해준다.

https://miro.medium.com/v2/resize:fit:862/1*teHyYLLGKwZT-VZfB2gthg.png

 

주의할 점은 '매개변수' '공변량'을 구분하여 매개변수는 성향점수추정에 절대 고려하지 않아야 한다는 것이다.

매개변수는 원인 변수가 결과 변수에 미치는 영향을 중간에서 매개하는 변수를 뜻한다. 즉, 원인 변수는 매개변수를 통해 결과 변수에 영향을 미칠 수 있는 것이다.

현실적으로 무엇이 매개변수인지 공변량인지 구분하는 것이 어려울 수 있지만, 우선 원인처치가 발생한 이후에 측정된 것은 매개변수로 간주하는 것이 좋다.

 

또, 만약 표본이 충분하지 않은 경우에는 원인 배치와는 관련이 있지만 결과 변수와는 관련이 없는 공변량을 꼭 포함하지 않아도 된다. 하지만 원인 배치와는 관련이 없지만 결과 변수와는 관련이 있는 공변량의 경우는 포함시키는 것이 좋다.

 

 

2. 성향점수추정

성향점수(PS, Propensity Score)란 공변량들이 주어졌을 때, 표본 내 사례가 처치 집단에 배치될 확률이다.

일반적으로 로지스틱 모형 같은 분류 모형을 사용하여 성향점수를 추정하고, 이를 활용해서 가중치를 계산하면 된다.

 

로지스틱으로 성향점수를 추정할 때는 종속변수를 원인 배치 변수, 독립변수를 앞에서 선정한 공변량으로 한다.

성향점수로는 로지스틱 모형의 추정 값 그대로 확률 (0~1)을 사용할 수도 있고,

확률 대신 로지스틱 함수로 확률값으로 변환시키기 이전의 선형 로짓(-∞~∞)을 사용할 수도 있다. 

확률이 0 또는 1에 너무 가까운 경우를 다루기에는 선형 로짓이 적절하지만, IPTW에서는 음수를 가중치로 사용할 수 없으므로 확률을 사용한다.

 

3. 공통지지영역 점검

성향점수를 추정했다면 control군과 test군의 성향점수가 얼마나 겹쳐지는지 점검해야한다.

두 군의 성향점수가 겹쳐지는 구간을 공통지지영역이라 하고, 만약 겹쳐지는 영역이 없는 분리현상이 일어나는 경우 두 군은 비교될 수 없다.

 

일반적으로 확률밀도함수, 히스토그램, 박스플롯 등을 그려 공통지지영역을 확인한다.

https://www.researchgate.net/profile/Daniel-Zaga-Szenker/publication/284189216/figure/fig1/AS:391431240863745@1470335888084/The-Common-Support-Region.png

 

 

4. IPTW 계산

이제 앞에서 계산한 성향점수를 이용해서 성향점수 가중치를 계산한다.

아래는 효과추정치 종류에 따른 IPTW 계산 공식이다.

 

$$iptw_i^{ATE} = \frac{T_i}{e_i(X)} + \frac{1-T_i}{1-e_i(X)}$$

 

$$iptw_i^{ATT} = T_i + \frac{1-T_i}{1-e_i(X)}$$

 

$$iptw_i^{ATC} = \frac{T_i}{e_i(X)} + (1-T_i)$$

- \( T_i \)는 개체 \( i \)의 치료 여부
- \( e_i(X) \)는 개체 \( i \)의 성향점수

 

성향 점수는 각 개체가 처치 집단에 배정될 확률을 뜻하므로,

1에 가까울수록 해당 사례가 처치집단 내에서 흔히 등장할 것이고 0에 가까울수록 드물게 나타날 것임을 알 수 있다.

IPTW는 상대적으로 희귀한 사례들에 더 높은 가중치를 부여하고, 흔하게 나타날 수 있는 사례들에 더 낮은 가중치를 부여한다.

 

5. 공변량 균형성 점검

데이터에 IPTW 가중치를 부여하였다면 공변량들이 균형성 있게 조정되었는지 확인해야 한다.

이를 위해 SMD(Standardized Mean Difference)를 확인해서 처치 집단과 통제 집단 사이 공변량들의 표준화된 평균 차이를 확인한다.

 

SMD에 대한 기준에는 여러 해석이 있지만 일반적으로 0.1보다 작은 경우 두 집단이 충분히 유사하고, 0.25보다 작은 경우 두 집단 간 차이가 적다라고 해석할 수 있다.

 

  • < 0.1: 매우 작은 효과, 두 집단이 거의 차이가 없음.
  • 0.1~0.2: 작은 효과, 두 집단의 차이가 적음.
  • 0.3~0.5: 중간 정도 효과, 두 집단 간 어느 정도 차이가 있음.
  • > 0.5: 큰 효과, 두 집단 간 차이가 큼.

 

 

여기까지 관측 연구에서 공변량의 불균형을 조정하기 위한 IPTW 기법에 대해 알아보았다.

다음 포스팅에서 예시를 통해 R에서 직접 IPTW를 수행하는 방법에 대해 알아보겠다!