Stats & AI tech blog - '일단 시도함'

[통계] Variation Component (변이 구성 요소) (1) 본문

Statistics & AI/Multilevel Model

[통계] Variation Component (변이 구성 요소) (1)

justdoit ok? 2023. 11. 22. 22:29

경시적 자료는 한 개체를 반복적으로 관찰하거나 시간의 추이에 따라 표집된 자료이다. 한 개체 내 측정치들 간에 연관성이 존재하므로 공분산이 0이 아니게 되며 변이를 구성하는 요소를 통해 공분산 구조를 추정한다.

 

  • 평균 함수를 통한 경시적 자료 표현

$$y_{ij} = \mu(t_{ij}) + \epsilon_{ij}$$

 

 

  • 변이를 구성하는 요소

1) 개체 간 변이 (between-individual heterogeneity)

2) 개체 내 변이 (within-individual variation)

3) 측정 오차 (measurement error)

 

 

  • 개체 간 변이

개체 간 변이는 개체별 랜덤 효과(subject-specific random effect)로 표현할 수 있다.

 

개체별 랜덤 효과는 일변량 정규분포를 이용하여 다음과 같이 가정될 수 있다.

$$b_i \sim N(0, \sigma_b^2)$$

 

공변량 q개에 대한 개체 간 변이가 존재하는 경우, q개의 랜덤 효과는 다변량 정규분포를 이용하여 다음과 같이 가정될 수 있다.

$$(b_{i1}, ..., b_{iq}) \sim MVN(0, G)$$

 

ex1) 시간에 대한 개체 간 변이가 존재하는 경우 

 

$$ E[Y_{ij}|b_{i0}, b_{i1}] = \beta^{'}X_{ij} + b_{i0} + b_{i1}t_{ij}$$

$b_{i0}$ : 개체별 랜덤 효과

$b_{i1}$ : 시간에 따른 개체별 랜덤 효과

$(b_{i0}, b_{i1})^{'}$은 이변량 정규분포를 따른다.

 

랜덤 효과가 주어졌을 때 $Y_{ij}$의 기댓값은,

공변량의 선형조합 + 개체별 랜덤효과 + 시간에 대한 개체별 랜덤효과*시간으로 나타낼 수 있다.

 

 

ex2) 특정 공변량 (약물 trt)에 대한 개체 간 변이가 존재하는 경우

 

$$ E[Y_{ij}|b_{i0}, b_{i1}] = \beta_0 + \beta_1trt_i + b_{i0} + b_{i1}trt_{i}$$

$\beta_1$ : 약물의 평균 효과

$b_{i0}$ : 개체별 변이

$b_{i1}$ : 약물에 따른 개체별 변이

$(b_{i0}, b_{i1})^{'}$은 이변량 정규분포를 따른다.

 

랜덤 효과가 주어졌을 때 $Y_{ij}$의 기댓값은,

y절편 + 약물의 평균효과*약물 + 개체별 랜덤효과 + 약물에 대한 개체별 랜덤효과*약물으로 나타낼 수 있다.

 

 

ex3) 특정 공변량 (약물 trt, 시간 t)에 대한 개체 간 변이가 존재하는 경우

 

$$ E[Y_{ij}|b_{i0}, b_{i1}, b_{i2}] = \beta_0 + \beta_1trt_i+ \beta_2t_{ij} + b_{i0} + b_{i1}trt_{i}+ b_{i2}t_{ij}$$

$\beta_1$ : 약물의 평균 효과

$\beta_2$ : 시간의 평균 효과

$b_{i0}$ : 개체별 변이

$b_{i1}$ : 약물에 따른 개체별 변이

$b_{i2}$ : 시간에 따른 개체별 변이

$(b_{i0}, b_{i1}, b_{i2})^{'}$은 삼변량 정규분포를 따른다.

 

랜덤 효과가 주어졌을 때 $Y_{ij}$의 기댓값은,

y절편 + 약물의 평균효과*약물 + 시간의 평균효과*시간 + 개체별 랜덤효과 + 약물에 대한 개체별 랜덤효과*약물 + 시간에 대한 개체별 랜덤효과*시간으로 나타낼 수 있다.