통계공부합니다

[통계] Variation Component (변이 구성 요소) (2) 본문

Statistics & AI/Multilevel Model

[통계] Variation Component (변이 구성 요소) (2)

justdoit ok? 2023. 11. 29. 23:28

경시적 자료는 한 개체를 반복적으로 관찰하거나 시간의 추이에 따라 표집된 자료이다. 한 개체 내 측정치들 간에 연관성이 존재하므로 공분산이 0이 아니게 되며 변이를 구성하는 요소를 통해 공분산 구조를 추정한다.

 

  • 평균 함수를 통한 경시적 자료 표현

yij=μ(tij)+ϵij

 

 

  • 변이를 구성하는 요소

1) 개체 간 변이 (between-individual heterogeneity)

2) 개체 내 변이 (within-individual variation)

3) 측정 오차 (measurement error)

 

 

  • 개체 내 변이

1) 자기공분산함수 (Auto-covariance function) : 완전 균형 자료인 경우 (동일한 시점에서 동일한 반복 횟수로 측정된 자료)

2) 변이도 (Variogram) : 일반적인 경시적 자료에서 사용

 

 

1. 자기공분산함수 (Auto-covariance function)

  • 자기공분산함수 (Auto-covariance function)

γ(t,t+u)=cov(Y(t),Y(t+u))=E[(Y(t)μ(t))(Y(t+u)μ(t+u))]

 

γ(t,t+u)=0인 경우, 두 시점 간 반응치들은 독립이다.

 

γ(t,t+u)=0 인 경우, 시점에 상관없이 시간 차(u)에 의해 결정된다. (이차정상성 또는 약한정상성)

 

γ(t,t+u)=0 인 경우, 모든 시점에서의 분산이 같다.

 

  • 자기상관함수 (ACF, Auto-correlation function)

ρ(u)=C(u)C(0)

 

  • 상관도표

(u,ρ(u)) 로 그려지는 상관도표

 

 

 

 

2. 변이도 (Variogram)

: 정상적인 자료에서 효과적으로 사용된다. 자료가 2차 정상과정을 따른다고 가정하고 변이도를 살펴보자.

 

가정) 이차정상성 자료

1. 모든 t에 대해 E[et]=0이다.

2. cov(et,etd)d에만 영향을 받는다.

3. 모든 t에 대해 var(et)=σ2이다.

 

  • 변이도 (variogram)

˜γ(d)=E[(etetd)2]=E[e2t]+E[e2td]2E[etetd]=2σ2(1ρ(d))

 

  • 준변이도 (semi-variogram)

γ(d)=˜γ(d)/2

 

  • 상관함수 ρ 정의
  • 지수상관모형(exponential correlation) : ρ(u)=exp(ϕu) 
  • 가우스 상관모형(gaussian correlation) : ρ(u)=exp(ϕu2)