목록bias (3)
Stats & AI tech blog - '일단 시도함'
정확도(Accuracy)와 정밀도(Precision)는 측정이나 실험 결과의 신뢰성을 평가하는 중요한 개념이다.둘 다 측정 결과의 품질을 나타내는 지표지만 각각의 의미는 다르다. 1. 정확도(Accuracy)정확도란, 특정 조건 하에서 측정된 값이 알려진 참값에 얼마나 가까운지를 나타내는 정도이다. 표적의 중심에 화살을 맞히는 것이 높은 정확도를 가지는 것으로 이해할 수 있다. 예를 들어, 체온계로 사람의 체온을 잴 때 실제 체온에 가깝게 측정할수록 높은 정확도를 가지는 체온계라고 할 수 있다.2. 정밀도(Precision)정밀도는 동일한 조건에서 반복 측정했을 때 결과들이 얼마나 일관되게 나오는지를 의미한다.정밀도는 무작위 오류의 분포에 영향을 받고, 정밀도가 높다고 해서 반드시 참값에 가깝다는 뜻은 ..
이번 포스팅에서는 통계학에서 중요한 개념인 편향(bias)과 분산(variance)에 대해 알아보고자 한다. 1. 편향과 분산편향이란, 추정 결과가 한쪽으로 치우쳐있는 경향을 말한다.머신러닝에서는 편향을 통해 예측값들이 정답에서 얼마나 멀리 떨어져 있는지를 나타낼 수 있다. 분산이란, 데이터들이 흩어져있는 정도를 의미한다.머신러닝에서는 분산을 통해 어떤 포인트에 대한 모델 예측 결과의 가변성을 나타낸다. 위쪽 첫 번째 과녁은 모든 결과가 원점에 가깝게 모여져 있다. 이런 경우는 낮은 편향, 낮은 분산을 가진다.위쪽 두 번째 그림은 모든 결과가 원점 중심으로 퍼져있다. 이런 경우는 낮은 편향을 가지지만 상대적으로 높은 분산을 가진다. 아래쪽 첫 번째 그림은 모든 결과가 원점에서 떨어진 거리에 가깝게 모여..
1. 성향점수매칭(PSM) 이란?무작위 대조군 연구(RCT)가 불가능한 관찰 연구에서 실험군과 대조군 그룹 간 비교를 위해 사용되는 통계적 기법이다.표본 추출 과정에서 적절한 랜덤화가 이루어지지 않았을 경우에는 특정 공변량(covariate)에 의해 통계 분석 결과가 왜곡되는 선택 편향(selection bias)이 발생할 수 있다. 이런 공변량들은 실험군과 대조군 사이의 결과 차이를 규명하는데 혼란 변수로 작용하게 된다. PSM은 주요 관심인 독립변수가 종속변수에 미치는 영향을 평가하고자 할 때, 그 관계에 영향을 미칠 수 있는 공변량의 편향(bias)를 줄이고자 사용되는 통계기법이다. 2. PSM 절차1) 성향 점수 계산처치 변수를 종속변수로, 혼란 변수을 독립변수로 두고 로지스틱 회귀 분석 등의 ..