목록SVM (2)
Stats & AI tech blog - '일단 시도함'
이번 포스팅에서는 R의 caret 패키지로 쉽게 모델을 학습 & 튜닝하는 방법에 대해 알아보겠다. 아래는 모델을 튜닝하기 위해 먼저 고려해야할 요소이다.어떤 모델을 다룰지 선택 ex) SVM모델을 튜닝하기 위해서 어떤 parameters를 사용할 것인지 선택 ex) C, kernel,,학습에 사용할 데이터를 어떻게 resampling 할지 선택 ex) 10-fold Cross Validation 예시로 SVM 분류 모델을 학습 & 튜닝하는 과정에 대해 알아보겠다. 1. Resampling 방법 지정 (trainControl)먼저 caret 패키지의 trainControl 함수를 통해 Resampling 방식을 지정한다.아래 코드는 K-fold Cross Validation을 여러번 반복해서 샘플링하는 ..
이번 포스팅에서는 머신러닝 분류 알고리즘 중 하나인 서포트 벡터 머신(SVM)에 대해 알아보려고 한다.SVM은 Decision Tree나 인공신경망과 함께 자주 사용되는 분류 기법이며, 특히 이진 데이터(binary data) 분류 문제에서 좋은 성능을 보이는 것으로 알려져 있다. 1. 서포트 벡터 머신 (SVM)SVM은 데이터를 분류하는 결정 경계(Decision Boundary)을 정의해서 초평면(hyperplane)을 선택하는 알고리즘이다.SVM에 사용되는 몇 가지 개념을 알아보자. 1.1 결정 경계 (Decision Boundary) / 초평면 (Hyperplane)왼쪽 그림처럼 분류할 집단을 구분하는 속성이 2차원인 경우에는 선(line)으로 두 집단을 구분할 수 있다. 이렇게 집단을 구분하는..