목록Kaggle (4)
TechBlog

📌 주제 PUBG 배틀그라운드 게임 데이터 분석 📖 순서 1. 주제 정의 2. 게임 설명 3. 활용 데이터 및 변수 4. 자료 분석 과정 1. 주제 정의 주제: PUBG 배틀그라운드 게임 데이터 분석 요약: PUBG Developer에서 공개한 배틀그라운드 데이터를 활용한 분석 프로젝트를 진행했습니다. 분석 내용: EDA, 전처리, 시각화를 위주로 분석을 진행했고, 플레이어 등급의 최종 배치를 예측하는 RandomForest 모델도 basic하게 만들어보았습니다. 2. 게임 설명 📖 게임 개요 배틀그라운드는 플레이어가 돌아다니면서 무기, 총알, 방어구, 구급약 등을 수집하고 서로 죽이며 최후까지 살아남는 게임입니다. 게임 시작 시 플레이어들은 비행기에 탄 상태이며, 각자 원하는 위치에 낙하한 후 파밍(아..

2022년 8월 6일에 velog 블로그에 작성한 글을 옮겼습니다. 📌 주제: House Price prediction 📖 참고 솔루션: Stacked Regressions : Top 4% on LeaderBoard(by Serigne) ✔️ Understand the problem ⚡ 변수, 데이터셋 살펴보기 ✏️ 필요한 라이브러리 불러오기 # 라이브러리 불러오기 import numpy as np import pandas as pd # data processing, CSV file I/O import matplotlib.pyplot as plt %matplotlib inline import seaborn as sns color = sns.color_palette() sns.set_style('darkg..

2022년 7월 31일에 velog 블로그에 작성한 글을 옮겼습니다. 📌 주제: House Price exploration 📖 참고 솔루션 Comprehensive data exploration with Python(by Pedro Marcelino) ✔️ Understand the problem ⚡ 변수, 데이터셋 살펴보기 ✏️ 필요한 라이브러리 불러오기 # 라이브러리 불러오기 import pandas as pd import matplotlib.pyplot as plt %matplotlib inline import seaborn as sns import numpy as np from scipy.stats import norm from sklearn.preprocessing import StandardS..

2022년 7월 14일에 velog 블로그에 작성한 글을 옮겼습니다. 📌 주제: titanic 사고로 인한 생존 여부 예측 📖 참고 솔루션 Titanic Data Science Solutions(by MANAV SEHGAL) 📖 순서 1. 문제 정의 2. 훈련, 시험 데이터 준비 3. 데이터 전처리 4. 데이터 분석 5. 모델링 및 예측 ※ 위 순서는 조금씩 바뀌거나 서로 결합될 수 있음 ✔️ 문제 정의 1912년 4월 15일, 타이타닉 호가 빙산과 충돌하여 침몰함 당시 전체 2,224명의 승객 중 1,502명이 사망함 (생존율: 32%) 특정 집단(여성, 어린이 등)이 다른 집단에 비해 비교적 생존율이 높았음 목표: 타이타닉 호 승객 정보를 이용해, 타이타닉 사고로 인한 생존 여부를 예측함 ✔️ 훈련,..