목록Total (94)
Stats & AI tech blog - '일단 시도함'
1. apply행 단위 또는 열 단위 연산을 가능하게 한다. input 데이터로 모두 같은 타입의 변수형을 가진 배열(Array), 매트릭스(Matrix), 데이터 프레임(Dataframe)이 가능하다.연산결과는 매트릭스 또는 벡터 형태로 출력된다. * 행 단위, 열 단위 평균 구하기# calculate row meanapply(data, 1, mean)# calculate column meanapply(data, 2, mean) 2. sapplyfor문을 대체하여 주로 쓰이며, 연산 결과는 벡터 또는 행렬 형태로 출력된다. sapply( , simplify = F) 인 경우 또는 input 데이터가 길이가 다른 리스트인 경우, lapply( ) 와 동일하게 리스트 형태로 출력된다. * 특정 열의 데이..
경시적 자료는 한 개체를 반복적으로 관찰하거나 시간의 추이에 따라 표집된 자료이다. 한 개체 내 측정치들 간에 연관성이 존재하므로 공분산이 0이 아니게 되며 변이를 구성하는 요소를 통해 공분산 구조를 추정한다. 평균 함수를 통한 경시적 자료 표현$$y_{ij} = \mu(t_{ij}) + \epsilon_{ij}$$ 변이를 구성하는 요소1) 개체 간 변이 (between-individual heterogeneity)2) 개체 내 변이 (within-individual variation)3) 측정 오차 (measurement error) 개체 간 변이개체 간 변이는 개체별 랜덤 효과(subject-specific random effect)로 표현할 수 있다. 개체별 랜덤 효과는 일변량 정규분포를 이용하..
1. 기술통계량 확인#요약통계량 확인summary(data)#summary보다 많이 보여줌library(psych)describe(data[, c("Age", "difftime")])#좀 더 많이 보여줌library(pastecs)round(stat.desc(data[, c("Age", "difftime")], basic = T, desc = T, norm = T, p= 0.9)) 2. 기술통계량 테이블 (finalfit, knitr)# finalfit :: summary_factorlistexplanatory = c("age.factor", "sex.factor", "obstruct.factor") #설명변수dependent = 'mort_5yr' #독립변수(그룹)colon_s %>% summary..
1. 공분산분석이란?독립변수가 종속변수에 순수하게 미치는 영향을 파악하기 위해 외생변수를 공변량으로 통제하여 분석외생 변수 : 종속변수에 영향을 미칠 수 있으나 독립변수가 아닌 변수공변량 (공변수, 공변인, covariate variable) : 독립변수 이외에 영향을 미칠 수 있는 잡음 변인으로, 연구자가 통제하고자 하는 변인ANCOVA는 ANOVA에서 설명하지 못하는 집단 내 변동을 설명할 수 있게 한다.성별, 나이 등 여러 공변량을 사용할 수 있지만, 많은 공변량을 사용할 수록 자유도가 떨어진다.종속변수와 약한 상관을 가지는 공변량을 추가할 때는 오히려 검정력을 떨어뜨리기 때문에 주의해야한다. 2. 기본 가정독립변수는 범주형 자료이다.종속변수와 공변량은 연속형 자료이다.공변량과 종속변수는 선형적 ..