데이터 분석 프로젝트 [팀 프로젝트] 보험 납부금 기반 개인 의료비 예측 프로젝트 - 728x90 📚 보험 납부금 기반 개인 의료비 예측 프로젝트 📌 프로젝트 개요 수행 기간 2022.07 - 2022.08 사용 데이터 Medical Cost Personal Datasets (kaggle.com) 내용 Kaggle의 보험 납부금 데이터셋을 활용하여 과잉진료와 무분별한 의료비 증가를 방지하기 위한 의료비 예측 모델 개발 수행 역할 5인 팀 내 역할 | 주제 선정, 데이터 정제, ML모델링, 보고서 제작 사용 프로그램 및 언어 Brightics Studio, Python 성과 삼성SDS 서포터즈 단독우수팀 이 프로젝트에서는 의료비 선정에 개인의 나이, 성별, 자녀 수, 흡연 여부 등이 미치는 영향을 분석하고, 통계 검정을 통해 데이터 간 관계와 핵심 변수를 선정했다. 도출된 결과를 바탕으로 데이터를 정제하고, 데이터에 적합한 평가 지표를 선정하여 모델의 성능을 평가했으며,다양한 회귀 모델을 구축하여 비교했다. 가장 우수한 성능을 보인 XGB를 최종모델로 선정하여 파라미터 튜닝을 진행했다. 이 프로젝트를 통해 삼성 SDS 서포터즈의 우수팀으로 선정되었으며, 팀원들과의 상호작용을 통해 이상적인 팀워크를 쌓는 방법을 배웠다. 📑 프로젝트 보고서 Part1. 개요 Part2. 데이터 탐색 Part3. 데이터 전처리 Part4. 전체 모델링 Part5. 성별 모델링 Part6. 예측 결과 Part7. 데이터 파일 및 구현 코드 insurance.csv 0.05MB (최종)medical_cost_prediction.json 0.47MB 브라이틱스 스튜디오를 다운받은 후, 위 파일을 업로드하면 전체 코드를 보실 수 있습니다!😆 320x100 공유하기 URL 복사카카오톡 공유페이스북 공유엑스 공유 게시글 관리 구독하기DATA DIARY Contents 📚보험납부금기반개인의료비예측프로젝트 📌프로젝트개요 📑프로젝트보고서 Part1.개요 Part2.데이터탐색 Part3.데이터전처리 Part4.전체모델링 Part5.성별모델링 Part6.예측결과 Part7.데이터파일및구현코드 당신이 좋아할만한 콘텐츠 [팀 프로젝트] 신한라이프 고객 유치를 위한 거래 패턴 분석 2024.07.21 [팀 프로젝트] 분산 발전 주체 간 효율적인 P2P 전력매매 아이디어 2024.07.18 [팀 프로젝트] 2021 빅데이터 학습 아이디어 공모전 2024.07.14 [개인 프로젝트] 서울시 공공자전거의 빠른 회전율을 위한 대여 이력 분석 2024.07.13 댓글 0 + 이전 댓글 더보기