Stats & AI tech blog - '일단 시도함'
[통계] Variation Component (변이 구성 요소) (1) 본문
[통계] Variation Component (변이 구성 요소) (1)
justdoit ok? 2023. 11. 22. 22:29경시적 자료는 한 개체를 반복적으로 관찰하거나 시간의 추이에 따라 표집된 자료이다. 한 개체 내 측정치들 간에 연관성이 존재하므로 공분산이 0이 아니게 되며 변이를 구성하는 요소를 통해 공분산 구조를 추정한다.
- 평균 함수를 통한 경시적 자료 표현
$$y_{ij} = \mu(t_{ij}) + \epsilon_{ij}$$
- 변이를 구성하는 요소
1) 개체 간 변이 (between-individual heterogeneity)
2) 개체 내 변이 (within-individual variation)
3) 측정 오차 (measurement error)
- 개체 간 변이
개체 간 변이는 개체별 랜덤 효과(subject-specific random effect)로 표현할 수 있다.
개체별 랜덤 효과는 일변량 정규분포를 이용하여 다음과 같이 가정될 수 있다.
$$b_i \sim N(0, \sigma_b^2)$$
공변량 q개에 대한 개체 간 변이가 존재하는 경우, q개의 랜덤 효과는 다변량 정규분포를 이용하여 다음과 같이 가정될 수 있다.
$$(b_{i1}, ..., b_{iq}) \sim MVN(0, G)$$
ex1) 시간에 대한 개체 간 변이가 존재하는 경우
$$ E[Y_{ij}|b_{i0}, b_{i1}] = \beta^{'}X_{ij} + b_{i0} + b_{i1}t_{ij}$$
$b_{i0}$ : 개체별 랜덤 효과
$b_{i1}$ : 시간에 따른 개체별 랜덤 효과
$(b_{i0}, b_{i1})^{'}$은 이변량 정규분포를 따른다.
랜덤 효과가 주어졌을 때 $Y_{ij}$의 기댓값은,
공변량의 선형조합 + 개체별 랜덤효과 + 시간에 대한 개체별 랜덤효과*시간으로 나타낼 수 있다.
ex2) 특정 공변량 (약물 trt)에 대한 개체 간 변이가 존재하는 경우
$$ E[Y_{ij}|b_{i0}, b_{i1}] = \beta_0 + \beta_1trt_i + b_{i0} + b_{i1}trt_{i}$$
$\beta_1$ : 약물의 평균 효과
$b_{i0}$ : 개체별 변이
$b_{i1}$ : 약물에 따른 개체별 변이
$(b_{i0}, b_{i1})^{'}$은 이변량 정규분포를 따른다.
랜덤 효과가 주어졌을 때 $Y_{ij}$의 기댓값은,
y절편 + 약물의 평균효과*약물 + 개체별 랜덤효과 + 약물에 대한 개체별 랜덤효과*약물으로 나타낼 수 있다.
ex3) 특정 공변량 (약물 trt, 시간 t)에 대한 개체 간 변이가 존재하는 경우
$$ E[Y_{ij}|b_{i0}, b_{i1}, b_{i2}] = \beta_0 + \beta_1trt_i+ \beta_2t_{ij} + b_{i0} + b_{i1}trt_{i}+ b_{i2}t_{ij}$$
$\beta_1$ : 약물의 평균 효과
$\beta_2$ : 시간의 평균 효과
$b_{i0}$ : 개체별 변이
$b_{i1}$ : 약물에 따른 개체별 변이
$b_{i2}$ : 시간에 따른 개체별 변이
$(b_{i0}, b_{i1}, b_{i2})^{'}$은 삼변량 정규분포를 따른다.
랜덤 효과가 주어졌을 때 $Y_{ij}$의 기댓값은,
y절편 + 약물의 평균효과*약물 + 시간의 평균효과*시간 + 개체별 랜덤효과 + 약물에 대한 개체별 랜덤효과*약물 + 시간에 대한 개체별 랜덤효과*시간으로 나타낼 수 있다.
'Statistics & AI > Multilevel Model' 카테고리의 다른 글
[ML/DL] LMM, Linear Mixed-effect Model (선형 혼합효과 모형) (0) | 2024.02.07 |
---|---|
[통계] Variation Component (변이 구성 요소) (2) (0) | 2023.11.29 |