목록2024/07 (5)
Stats & AI tech blog - '일단 시도함'
이번 포스팅에서는 실험 설계 단계에서 고려해야 할 사항에 대해 알아보도록 하겠다. 통계 분석을 잘 한다 하더라도, 부적절한 실험을 통해 얻어진 결과는 신뢰할 수 없기 때문에 실험 설계 과정은 *매우* 중요하다. 실험 설계 단계의 가장 핵심은 반복 시행과 무작위화이다.추가로 간결성의 원칙, 검정력, 인위적 반복, 비직교성 등의 개념도 함께 이해해야 한다. 1. 간결성의 원칙특정 현상에 대한 설명들이 여러 개 존재할 경우, 가장 단순한 것을 선택해야 한다는 원칙이다. 통계 모형에서는 아래의 의미를 포함한다.모형은 되도록 적은 수의 모수를 포함.비선형 모형보다는 선형 모형을 사용.되도록 작은 수의 가정을 고려할 수 있는 실험을 선택.복잡한 설명보다는 단순한 설명을 선택. 2. 반복 시행 같은 시행이 이루..
이번 포스팅에서는 회귀 모형 등에서 변수를 선택하는 기법인 Stepwise 변수 선택법에 대해 알아보려한다. Stepwise 기법은 통계적 모델링에서 변수 선택 과정을 자동화하는 방법 중 하나인데,회귀 분석과 같은 모델링에서 효율적으로 변수 선택을 가능하게 하고 과적합(overfitting) 방지에 도움을 준다. 1. Stepwise 기법 종류 및 절차stepwise 기법에는 전진 선택법과 후진 제거법, 그리고 이 두 가지를 결합한 방식이 존재한다. 전진 선택법 (Forward Selection)아무런 변수가 포함되지 않은 초기 모델에서 시작하며, 선택 기준을 만족하는 변수가 없을 때까지 각 단계마다 모델에 추가할 변수를 하나씩 선택한다.장점 : 단순하고 직관적이며 계산 비용이 적다. 초기 단계에서 과..
이번 포스팅에서는 R for문 등에서 변수를 바꿔가며 동적으로 처리하는 방법에 대해 알아보고자 한다.아래 모든 방법을 다 알 필요는 없고, 몇 가지만 알아둬도 유용하게 사용할 수 있다. 1. !!, !!!`!!`와 `!!!`는 주로 `rlang` 패키지와 함께 사용되며, 비표준 평가(non-standard evaluation, NSE)에서 변수를 언바운딩하는 데 사용된다. `!!`는 단일 변수, `!!!`는 여러 변수를 언바운딩하는 데 사용된다. * 비표준 평가(non-standard evaluation, NSE) : 함수의 인자에 표현식을 할당할 당시에는 평가(계산, 실행)을 수행하지 않고, 함수 내부의 원하는 곳에서 실행하도록 하는 것.library(rlang)var % mutate(new_col ..
오늘은 R에서 내가 만든 함수를 모아 라이브러리(패키지)를 만들어 보려고 한다.자주 쓰는 함수를 모아 놓고 편하게 쓸 수 있을 것 같다. 라이브러리(패키지)를 만드는 순서는 아래와 같다. 1. 패키지 구조 생성2. 패키지 메타데이터 생성3. 함수 파일, 도움말 문서 작성4. 패키지 빌드 및 설치 1. 패키지 구조 생성먼저 패키지를 저장할 디렉토리와 그 안에 필요한 메타 데이터를 생성해야한다.'usethis' 패키지를 사용하면 구조를 자동으로 생성할 수 있다.install.packages("usethis")library(usethis)# 패키지 구조 생성create_package("path/to/your/package") 위 코드를 실행하면 지정된 경로에 폴더(나는 이름을 zim으로 생성)가 생성되고 안..
* ChatGPT를 이용한 논문 해석입니다. 1. Abstract논문의 초록은 불균형 시계열 분류 문제에 대해 다루고 있습니다.특히, 이 논문에서는 정확성보다는 클래스별 최소 재현율(minimum recall)을 최대화하는 시계열 분류기를 학습하는 방법을 제안합니다. 이를 통해 모든 클래스에 동일한 중요성을 부여하는 분류기를 얻을 수 있습니다. 최소 재현율은 미분 가능한 함수가 아니기 때문에 일반적인 그래디언트 기반 학습 방법을 사용할 수 없습니다. 따라서 우리는 최소 재현율 함수의 여러 부드러운 근사치(smooth approximations)를 적용하고 평가합니다. 철저한 실험적 평가를 통해 우리의 접근 방식이 불균형 시계열 분류에서 사용되는 최첨단 방법들의 성능을 개선하고, 정확성의 약간의 손실만으..