데이터분석프로젝트
-
📚 보험 납부금 기반 의료비 예측 프로젝트📌 프로젝트 개요 수행 기간2022.09사용 데이터Kaggle 오픈 데이터 사용 프로그램 및 언어 Brightics Studio, Python 📌 주제 선정 배경여러 사람들이 접할 수 있으면서 많은 배경지식을 요구하지 않는 데이터였으면 좋겠다.공공 데이터로 구현할 수 있어야한다.모두가 접해보지 않았던 주제의 데이터였으면 좋겠다. 세 가지 주제 중 투표를 통해 보험 납부금에 기반해 의료비 예측 프로젝트를 진행하기로 했으며,Kaggle의 https://www.kaggle.com/datasets/mirichoi0218/insurance 데이터를 활용하기로 결정했다. Medical Cost Personal DatasetsInsurance Forecast by u..
[삼성 SDS Brightics] 보험 납부금 기반 의료비 예측 프로젝트📚 보험 납부금 기반 의료비 예측 프로젝트📌 프로젝트 개요 수행 기간2022.09사용 데이터Kaggle 오픈 데이터 사용 프로그램 및 언어 Brightics Studio, Python 📌 주제 선정 배경여러 사람들이 접할 수 있으면서 많은 배경지식을 요구하지 않는 데이터였으면 좋겠다.공공 데이터로 구현할 수 있어야한다.모두가 접해보지 않았던 주제의 데이터였으면 좋겠다. 세 가지 주제 중 투표를 통해 보험 납부금에 기반해 의료비 예측 프로젝트를 진행하기로 했으며,Kaggle의 https://www.kaggle.com/datasets/mirichoi0218/insurance 데이터를 활용하기로 결정했다. Medical Cost Personal DatasetsInsurance Forecast by u..
2024.11.08 -
📚 통신사 고객 이탈 예측을 통한 매출 증대 및 대응 방안 마련📌 프로젝트 개요수행 기간2023.04~2023.05사용 데이터Z통신사 고객 정보 데이터 (하단 첨부)사용 프로그램 및 언어 Google Colab, Python, Scikit-learn, XAI, A/B 테스트Z통신사 충성 고객 전환 솔루션에서 활용한 데이터를 재활용해 개인적으로 프로젝트를 수행하고 보고서를 다시 제작했다.기존의 분석보다 다양한 변수 기준을 두어 고객 이탈에 영향을 미치는 인자를 파악하고,이를 활용해 기획할 수 있는 개선안을 제시해 보고서의 질과 양을 풍성히 했다.또한 발굴한 인자를 바탕으로 통제그룹과 실험그룹을 두어 A/B 테스트를 시도하고,고객 이탈 방지를 위한 프로모션을 최적화했다.아래는 프로젝트에 관한 내용이다.?..
[개인 프로젝트] 통신사 고객 이탈 예측을 통한 매출 증대 및 대응 방안 마련📚 통신사 고객 이탈 예측을 통한 매출 증대 및 대응 방안 마련📌 프로젝트 개요수행 기간2023.04~2023.05사용 데이터Z통신사 고객 정보 데이터 (하단 첨부)사용 프로그램 및 언어 Google Colab, Python, Scikit-learn, XAI, A/B 테스트Z통신사 충성 고객 전환 솔루션에서 활용한 데이터를 재활용해 개인적으로 프로젝트를 수행하고 보고서를 다시 제작했다.기존의 분석보다 다양한 변수 기준을 두어 고객 이탈에 영향을 미치는 인자를 파악하고,이를 활용해 기획할 수 있는 개선안을 제시해 보고서의 질과 양을 풍성히 했다.또한 발굴한 인자를 바탕으로 통제그룹과 실험그룹을 두어 A/B 테스트를 시도하고,고객 이탈 방지를 위한 프로모션을 최적화했다.아래는 프로젝트에 관한 내용이다.?..
2024.10.14 -
📚 척추 질환 환자의 특성을 반영한 개인화 서비스 개발로 수익성 향상 📌 프로젝트 개요 수행 기간2024.02 - 2024.04사용 데이터포스코 아카데미 제공내용60만건의 환자 진료 데이터를 분석하고, 수술 결과 예측 모델과 재발 예측 모델을 구축함.또한 이를 활용해 새로운 고객 경험을 제공할 수 있는 프로모션과 서비스를 기획 및 디자인함. 사용 프로그램 및 언어 Python, Google Colab, Pandas, scikit-learn 2024.07.23 - [데이터 분석 프로젝트] - [팀 프로젝트] 환자의 특성을 반영한 개인화 서비스 개발로 수익성 향상 [팀 프로젝트] 환자의 특성을 반영한 개인화 서비스 개발로 수익성 향상📚 환자의 특성을 반영한 개인화 서비스 개발로 수익성 향상 📌 프로..
[개인 프로젝트] 척추 질환 환자의 특성을 반영한 개인화 서비스 개발로 수익성 향상📚 척추 질환 환자의 특성을 반영한 개인화 서비스 개발로 수익성 향상 📌 프로젝트 개요 수행 기간2024.02 - 2024.04사용 데이터포스코 아카데미 제공내용60만건의 환자 진료 데이터를 분석하고, 수술 결과 예측 모델과 재발 예측 모델을 구축함.또한 이를 활용해 새로운 고객 경험을 제공할 수 있는 프로모션과 서비스를 기획 및 디자인함. 사용 프로그램 및 언어 Python, Google Colab, Pandas, scikit-learn 2024.07.23 - [데이터 분석 프로젝트] - [팀 프로젝트] 환자의 특성을 반영한 개인화 서비스 개발로 수익성 향상 [팀 프로젝트] 환자의 특성을 반영한 개인화 서비스 개발로 수익성 향상📚 환자의 특성을 반영한 개인화 서비스 개발로 수익성 향상 📌 프로..
2024.10.14 -
📚 신용카드 승인 예측(Credit Card Approval Prediction)📌 프로젝트 개요 수행 기간2022.07사용 데이터Kaggle 오픈 데이터 사용 프로그램 및 언어 Brightics Studio, Python 📌 주제 선정 배경다루어보지 못했던 주제의 데이터를 활용한다.공공 데이터로 구현할 수 있어야한다. 브라이틱스 스튜디오로 해보는 첫 분석이니 많이 구현해본 이진분류_예측 모델을 만들어보자. 이 세 가지를 고려해 데이터를 찾아보았으며, Kaggle의 Credit Card Approval Prediction (kaggle.com) 데이터를 활용하기로 결정했다. Credit Card Approval PredictionA Credit Card Dataset for Machine Lea..
[삼성 SDS Brightics] 신용카드 승인 예측(Credit Card Approval Prediction)📚 신용카드 승인 예측(Credit Card Approval Prediction)📌 프로젝트 개요 수행 기간2022.07사용 데이터Kaggle 오픈 데이터 사용 프로그램 및 언어 Brightics Studio, Python 📌 주제 선정 배경다루어보지 못했던 주제의 데이터를 활용한다.공공 데이터로 구현할 수 있어야한다. 브라이틱스 스튜디오로 해보는 첫 분석이니 많이 구현해본 이진분류_예측 모델을 만들어보자. 이 세 가지를 고려해 데이터를 찾아보았으며, Kaggle의 Credit Card Approval Prediction (kaggle.com) 데이터를 활용하기로 결정했다. Credit Card Approval PredictionA Credit Card Dataset for Machine Lea..
2024.08.05 -
📚 압연 공정에서의 scale 불량 분류 및 원인 인자 분석 프로젝트 📌 프로젝트 개요 수행 기간 2022.11 사용 데이터 아카데미 제공 내용압연 공정 시 발생하는 Scale의 불량을 분류하는 모델을 개발불량 예측에 영향을 미치는 인자 발굴사용 프로그램 및 언어Visual Studio Code, Python 포스코 AI/Bigdata 아카데미에서 수행한 빅데이터 분석 프로젝트로,아카데미에서 제공되는 데이터로 분석을 수행했다.압연 공정에서의 불량품 분류는 생산력의 최대화를 위해 요구된다. 스마트 공장은 불량품이 나오면 정확히 어느 시점에 왜 결함이 발생했는지 확인하고 이를 바탕으로 스마트 공장이 스스로 순간순간 이런 문제를 제어해 불량 발생을 최소화한다.프로젝트에서는 EDA와 가설검정을 통해 변수 간..
[개인 프로젝트] 압연 공정에서의 scale 불량 분류 및 원인 인자 분석 프로젝트📚 압연 공정에서의 scale 불량 분류 및 원인 인자 분석 프로젝트 📌 프로젝트 개요 수행 기간 2022.11 사용 데이터 아카데미 제공 내용압연 공정 시 발생하는 Scale의 불량을 분류하는 모델을 개발불량 예측에 영향을 미치는 인자 발굴사용 프로그램 및 언어Visual Studio Code, Python 포스코 AI/Bigdata 아카데미에서 수행한 빅데이터 분석 프로젝트로,아카데미에서 제공되는 데이터로 분석을 수행했다.압연 공정에서의 불량품 분류는 생산력의 최대화를 위해 요구된다. 스마트 공장은 불량품이 나오면 정확히 어느 시점에 왜 결함이 발생했는지 확인하고 이를 바탕으로 스마트 공장이 스스로 순간순간 이런 문제를 제어해 불량 발생을 최소화한다.프로젝트에서는 EDA와 가설검정을 통해 변수 간..
2024.07.24 -
📚 환자의 특성을 반영한 개인화 서비스 개발로 수익성 향상 📌 프로젝트 개요 수행 기간2022.10 - 2022.11사용 데이터포스코 아카데미 제공내용60만건의 환자 진단/수술 관련/엑스레이 데이터를 분석하고, 척추 이상 환자를 대상으로 환자의 특성을 반영한 서비스 개발수행 역할6인팀 내 역할 | 자료 조사, EDA, 예측 모델 개발, 개선안 도출 사용 프로그램 및 언어 Visual Studio Code, Python성과프로젝트 장려상 수상 환자의 진단 데이터, 수술 관련 데이터, 엑스레이 진단 데이터를 활용하여 데이터 분석뿐만 아니라 환자의 특성을 반영한 서비스를 기획하는 프로젝트를 진행하였다. 본 프로젝트는 척추 수술 환자와 척추 이상 환자를 대상으로 하는 프로젝트로, 수술 결과를 예측하는 모델..
[팀 프로젝트] 환자의 특성을 반영한 개인화 서비스 개발로 수익성 향상📚 환자의 특성을 반영한 개인화 서비스 개발로 수익성 향상 📌 프로젝트 개요 수행 기간2022.10 - 2022.11사용 데이터포스코 아카데미 제공내용60만건의 환자 진단/수술 관련/엑스레이 데이터를 분석하고, 척추 이상 환자를 대상으로 환자의 특성을 반영한 서비스 개발수행 역할6인팀 내 역할 | 자료 조사, EDA, 예측 모델 개발, 개선안 도출 사용 프로그램 및 언어 Visual Studio Code, Python성과프로젝트 장려상 수상 환자의 진단 데이터, 수술 관련 데이터, 엑스레이 진단 데이터를 활용하여 데이터 분석뿐만 아니라 환자의 특성을 반영한 서비스를 기획하는 프로젝트를 진행하였다. 본 프로젝트는 척추 수술 환자와 척추 이상 환자를 대상으로 하는 프로젝트로, 수술 결과를 예측하는 모델..
2024.07.23 -
📚 인천 시민의 금융 데이터 기반 소비금액 분석 및 예측 프로젝트📌 프로젝트 개요 수행 기간2022.10.- 2022.11.사용 데이터인천광역시_소비 데이터_20200630 | 공공데이터포털 (data.go.kr) 인천광역시_소득 데이터_20200630 | 공공데이터포털 (data.go.kr)내용인천 시민의 금융 데이터를 활용하여 다음달 소비 금액 예측 모델과 연도별 소비금액 예측 모델을 개발하여 비교 분석사용 프로그램 및 언어Brightics Studio, Python 인천 시민의 금융 데이터를 활용하여 다음달 소비 금액 예측 모델을 개발하고 연도별로 데이터를 분리하여 누적 소비금액 예측 모델을 개발한 뒤, 이를 비교분석했다. 또한 이 모델의 실현가능한 활용 방안을 다양하게 제시했다. 개인은 자신..
[개인 프로젝트] 인천 시민의 금융 데이터 기반 소비금액 분석 및 예측📚 인천 시민의 금융 데이터 기반 소비금액 분석 및 예측 프로젝트📌 프로젝트 개요 수행 기간2022.10.- 2022.11.사용 데이터인천광역시_소비 데이터_20200630 | 공공데이터포털 (data.go.kr) 인천광역시_소득 데이터_20200630 | 공공데이터포털 (data.go.kr)내용인천 시민의 금융 데이터를 활용하여 다음달 소비 금액 예측 모델과 연도별 소비금액 예측 모델을 개발하여 비교 분석사용 프로그램 및 언어Brightics Studio, Python 인천 시민의 금융 데이터를 활용하여 다음달 소비 금액 예측 모델을 개발하고 연도별로 데이터를 분리하여 누적 소비금액 예측 모델을 개발한 뒤, 이를 비교분석했다. 또한 이 모델의 실현가능한 활용 방안을 다양하게 제시했다. 개인은 자신..
2024.07.22 -
📚 신한라이프 고객 유치를 위한 거래 패턴 분석📌 프로젝트 개요 수행 기간2022.09사용 데이터신한금융그룹 제공 데이터 (사용 후 필수 폐기)내용 신한라이프 미가입 고객을 유치하기 위한 방안을 마련하기 위해 고객과 비고객의 거래 패턴을 분석하고, 군집화를 통해 군집별 맞춤 상품과 마케팅 방안을 제시했다. 수행 역할2인 팀 내 역할 | 팀장, 데이터 정제, 군집화, 결과 해석, 발표자료 제작 사용 프로그램 및 언어 Visual Studio Code, Python성과제 1회 신한금융그룹 빅데이터 해커톤 대회 장려상 수상 디지털 신기술 혁신공유대학들과 신한금융그룹이 함께 하는 빅데이터 해커톤 대회 ‘제1회 신·빅·해’에 참가했다. 이 대회는 신한은행, 신한카드, 신한금융투자, 신한라이프를 대상으로 소비..
[팀 프로젝트] 신한라이프 고객 유치를 위한 거래 패턴 분석📚 신한라이프 고객 유치를 위한 거래 패턴 분석📌 프로젝트 개요 수행 기간2022.09사용 데이터신한금융그룹 제공 데이터 (사용 후 필수 폐기)내용 신한라이프 미가입 고객을 유치하기 위한 방안을 마련하기 위해 고객과 비고객의 거래 패턴을 분석하고, 군집화를 통해 군집별 맞춤 상품과 마케팅 방안을 제시했다. 수행 역할2인 팀 내 역할 | 팀장, 데이터 정제, 군집화, 결과 해석, 발표자료 제작 사용 프로그램 및 언어 Visual Studio Code, Python성과제 1회 신한금융그룹 빅데이터 해커톤 대회 장려상 수상 디지털 신기술 혁신공유대학들과 신한금융그룹이 함께 하는 빅데이터 해커톤 대회 ‘제1회 신·빅·해’에 참가했다. 이 대회는 신한은행, 신한카드, 신한금융투자, 신한라이프를 대상으로 소비..
2024.07.21