목록Regression (2)
Stats & AI tech blog - '일단 시도함'
독립 변수를 바꿔가며 단변량 로지스틱 회귀 모형을 반복해서 만들어야할 때 사용하는 코드이다.개인 라이브러리의 함수로 저장해놓고 쓰기 편리하다. 모델에 사용할 종속 변수와 모든 독립 변수를 포함하는 데이터 프레임과 종속 변수명을 인자로 넣어주면 아래와 같은 결과를 출력한다.> uni_logistic_tb(df, 'Group') y label OR (CI 95%) p.value2 Group Age 1.025 (1.001-1.050) 0.0454 Group Gender1 1.156 (0.613-2.142) 0.6496 Group BSA 0.227 (0.053-0.939)..
1. Linear ModelResiduals : 예측 값과 실제 값의 차이로 작을수록 좋은 모델CoefficientsEstimate : 변수들에 부여된 가중치Std.Error : 추정치의 정확도를 보여주고 t-value 계산에 쓰임t-value & Pr(>|t|) : coefficent가 0과 비교하여 유의미하게 다른지 검정, Pr은 유의 수준Performance MeasuresResidual Standard Error : 잔차의 표준편차, 작을수록 좋다Multiple / Adjusted R-square : 모델로 설명 가능한 분산의 양을 뜻함. Adjusted는 변수 개수를 함께 고려한 값으로 Multiple Regression에서 유용. 전반적인 적합도를 요약하지만 모델의 타당성을 말하기에는 불충분하..