📚 보험 납부금 기반 개인 의료비 예측 프로젝트
📌 프로젝트 개요
수행 기간 |
2022.07 - 2022.08 |
사용 데이터 |
Medical Cost Personal Datasets (kaggle.com) |
내용 |
Kaggle의 보험 납부금 데이터셋을 활용하여 과잉진료와 무분별한 의료비 증가를 방지하기 위한 의료비 예측 모델 개발 |
수행 역할 |
5인 팀 내 역할 | 주제 선정, 데이터 정제, ML모델링, 보고서 제작 |
사용 프로그램 및 언어 |
Brightics Studio, Python |
성과 |
삼성SDS 서포터즈 단독우수팀 |
이 프로젝트에서는 의료비 선정에 개인의 나이, 성별, 자녀 수, 흡연 여부 등이 미치는 영향을 분석하고,
통계 검정을 통해 데이터 간 관계와 핵심 변수를 선정했다.
도출된 결과를 바탕으로 데이터를 정제하고, 데이터에 적합한 평가 지표를 선정하여
모델의 성능을 평가했으며,다양한 회귀 모델을 구축하여 비교했다.
가장 우수한 성능을 보인 XGB를 최종모델로 선정하여 파라미터 튜닝을 진행했다.
이 프로젝트를 통해 삼성 SDS 서포터즈의 우수팀으로 선정되었으며,
팀원들과의 상호작용을 통해 이상적인 팀워크를 쌓는 방법을 배웠다.
📑 프로젝트 보고서
Part1. 개요
Part2. 데이터 탐색
Part3. 데이터 전처리
Part4. 전체 모델링
Part5. 성별 모델링
Part6. 예측 결과
Part7. 데이터 파일 및 구현 코드
브라이틱스 스튜디오를 다운받은 후, 위 파일을 업로드하면 전체 코드를 보실 수 있습니다!😆