목록Programming (44)
Stats & AI tech blog - '일단 시도함'
지난 포스팅에서 3개 이상의 범주형 비교군 간 일치도를 확인하는 방법인 플레이스 카파에 대해 알아보았다.2024.11.22 - [Statistics & AI/Correlation] - [통계] Fleiss' kappa (플레이스의 카파) [통계] Fleiss' kappa (플레이스의 카파)Fleiss' kappa (플레이스의 카파) 이전 포스팅에서 카파 상관계수란 무엇인지와 Cohen's kappa에 대해 알아보았다.2024.01.11 - [Statistics & AI/Correlation] - [통계] Cohen's Kappa (코헨의 카파) [통계] Cohen's Kapmeowstudylog.tistory.com 이번 포스팅에서는 예제를 통해 R에서 플레이스 카파(Fleiss' kappa)를 계산..
지난 포스팅에서 R에서 IPTW와 생존분석을 진행하는 방법에 대해 알아보았다.2024.11.09 - [Programming/R] - [R] IPTW, Inverse Probability of Treatment Weighting (역확률가중치)2024.11.13 - [Programming/R] - [R] Survival Analysis (Kaplan-Meier, Log-rank, Cox PH) 이번 포스팅에서는 R에서 IPTW 가중치를 부여하여 Kaplan-Meier 생존 곡선을 그리는 방법에 대해 알아보겠다. {survival, survminer} 패키지의 survfit, ggsurvplot 함수를 조합하여 그리는 방법과{survey, jskm} 패키지의 svykm, svyjskm함수를 조합하여 그리는 ..
이전 포스팅에서 생존 분석의 개념, Kaplan-Meier 추정과 Log-rank test 그리고 Cox 비례위험모형까지 알아보았다. 이번 포스팅에서는 R에서 생존 분석을 수행하는 방법에 대해 알아보겠다. 분석 절차는 아래와 같다.1. Kaplan-Meier 생존 곡선 2. Log-rank Test3. Cox 비례 위험 모형 1. Kaplan-Meier 생존 곡선 먼저 'survival' 패키지의 survfit() 함수를 사용하여 카플란마이어 생존 곡선을 추정한다.survfit의 종속변수는 Surv(시간, 발생여부) 형식으로 넣어주고, 독립변수로는 group을 넣어 주어 각 그룹의 시간에 따른 발생 확률의 변화를 알아본다. surv_obj 'survminer' 패키지의 ggsurvplot() 함수를..
이전 포스팅에서 PSM 분석에 대한 개념을 알아보았다.2023.12.04 - [Statistics] - [통계] PSM: Propensity Score Matching (성향점수매칭) [통계] PSM: Propensity Score Matching (성향점수매칭)PSM: Propensity Score Matching (성향점수매칭) 1. 성향점수매칭(PSM) 이란? 무작위 대조군 연구(RCT)가 불가능한 관찰 연구에서 실험군과 대조군 그룹 간 비교를 위해 사용되는 통계적 기법이다.표meowstudylog.tistory.com 이번 포스팅에서는 R에서 PSM을 수행하는 절차에 대해 알아보자! 예시로 사용할 데이터의 원인 변수는 당뇨 여부(DM)이고 종속 변수는 골다공증 여부(Osteoporosis)이다..
이번 포스팅에서는 R에서 IPTW(역확률 가중치)를 수행하는 방법에 대해 알아보겠다.이론적인 설명은 아래 포스팅을 참고하자!2024.11.07 - [Statistics & AI/Propensity Score Analysis] - [통계] IPTW, Inverse Probability of Treatment Weighting (역확률가중치) [통계] IPTW, Inverse Probability of Treatment Weighting (역확률가중치)IPTW, Inverse Probability of Treatment Weighting (역확률가중치) 성향점수분석 기법 중 하나인 처치역확률가중치(IPTW, Inverse Probability of Treatement Weighting)는 가중치를 부여하여..
독립 변수를 바꿔가며 단변량 로지스틱 회귀 모형을 반복해서 만들어야할 때 사용하는 코드이다.개인 라이브러리의 함수로 저장해놓고 쓰기 편리하다. 모델에 사용할 종속 변수와 모든 독립 변수를 포함하는 데이터 프레임과 종속 변수명을 인자로 넣어주면 아래와 같은 결과를 출력한다.> uni_logistic_tb(df, 'Group') y label OR (CI 95%) p.value2 Group Age 1.025 (1.001-1.050) 0.0454 Group Gender1 1.156 (0.613-2.142) 0.6496 Group BSA 0.227 (0.053-0.939)..
https://school.programmers.co.kr/learn/challenges?order=recent&levels=4&languages=mysql 코딩테스트 연습 | 프로그래머스 스쿨개발자 취업의 필수 관문 코딩테스트를 철저하게 연습하고 대비할 수 있는 문제를 총망라! 프로그래머스에서 선발한 문제로 유형을 파악하고 실력을 업그레이드해 보세요!school.programmers.co.kr 1. 특정 세대의 대장균찾기SELECT A.IDFROM ECOLI_DATA AJOIN ECOLI_DATA BON A.PARENT_ID = B.IDJOIN ECOLI_DATA CON B.PARENT_ID = C.IDWHERE ISNULL(C.PARENT_ID)ORDER BY ID 2. 연간 평가점수에 해당하는 평가..
https://school.programmers.co.kr/learn/challenges?order=recent&languages=mysql&page=1&levels=3 코딩테스트 연습 | 프로그래머스 스쿨개발자 취업의 필수 관문 코딩테스트를 철저하게 연습하고 대비할 수 있는 문제를 총망라! 프로그래머스에서 선발한 문제로 유형을 파악하고 실력을 업그레이드해 보세요!school.programmers.co.kr 1. 대장균의 크기에 따라 분류하기 2SELECT A.ID, IF(PCT 2. 대장균의 크기에 따라 분류하기 1SELECT ID, IF(SIZE_OF_COLONY 3. 대장균들의 자식의 수 구하기SELECT A.ID, IF(ISNULL(B.CHILD_COUNT), 0, B.CHILD_COUN..
https://school.programmers.co.kr/learn/challenges?order=recent&levels=2&languages=mysql 코딩테스트 연습 | 프로그래머스 스쿨개발자 취업의 필수 관문 코딩테스트를 철저하게 연습하고 대비할 수 있는 문제를 총망라! 프로그래머스에서 선발한 문제로 유형을 파악하고 실력을 업그레이드해 보세요!school.programmers.co.kr 11. 재구매가 일어난 상품과 회원 리스트 구하기 (GROUP BY, HAVING)SELECT USER_ID, PRODUCT_IDFROM ONLINE_SALEGROUP BY USER_ID, PRODUCT_IDHAVING COUNT(*) > 1ORDER BY USER_ID ASC, PRODUCT_ID DESC 1..
https://school.programmers.co.kr/learn/challenges?order=recent&levels=2&languages=mysql 코딩테스트 연습 | 프로그래머스 스쿨개발자 취업의 필수 관문 코딩테스트를 철저하게 연습하고 대비할 수 있는 문제를 총망라! 프로그래머스에서 선발한 문제로 유형을 파악하고 실력을 업그레이드해 보세요!school.programmers.co.kr 1. 부모의 형질을 모두 가지는 대장균 찾기 (비트 연산)SELECT A.ID, A.GENOTYPE, B.GENOTYPE AS PARENT_GENOTYPEFROM ECOLI_DATA AJOIN ECOLI_DATA BON A.PARENT_ID = B.IDWHERE A.GENOTYPE & B.GENOTYPE = B...