목록Study/Data Analysis (5)
TechBlog

📌 주제 PUBG 배틀그라운드 게임 데이터 분석 📖 순서 1. 주제 정의 2. 게임 설명 3. 활용 데이터 및 변수 4. 자료 분석 과정 1. 주제 정의 주제: PUBG 배틀그라운드 게임 데이터 분석 요약: PUBG Developer에서 공개한 배틀그라운드 데이터를 활용한 분석 프로젝트를 진행했습니다. 분석 내용: EDA, 전처리, 시각화를 위주로 분석을 진행했고, 플레이어 등급의 최종 배치를 예측하는 RandomForest 모델도 basic하게 만들어보았습니다. 2. 게임 설명 📖 게임 개요 배틀그라운드는 플레이어가 돌아다니면서 무기, 총알, 방어구, 구급약 등을 수집하고 서로 죽이며 최후까지 살아남는 게임입니다. 게임 시작 시 플레이어들은 비행기에 탄 상태이며, 각자 원하는 위치에 낙하한 후 파밍(아..

2023년 1월 14일에 velog 블로그에 작성한 글을 옮겼습니다. 📌 주제 제주도 도로 교통량 예측 AI 모델 개발 📖 순서 1. 주제 정의 2. 필요성 및 목적 3. 활용 데이터 및 변수 4. 자료 분석 과정 1. 주제 정의 주제: 제주도 도로 교통량 예측 AI 모델 개발 요약: 제주도의 교통 정보를 이용하여 도로 교통량을 예측하는 모델을 만듦 2. 필요성 및 목적 (1) 현황 파악 제주도 내 주민등록인구는 2022년 기준 약 68만 명으로, 연평균 1.3% 정도 매년 증가하고 있음 또한 외국인과 관광객까지 고려하면 전체 상주인구는 90만 명을 넘을 것으로 추정되며, 제주도민 증가와 외국인의 증가로 현재 제주도의 교통체증이 심각한 문제로 떠오르고 있음 (2) 분석 목적 탐색적 데이터 분석을 통해 제..

2022년 8월 6일에 velog 블로그에 작성한 글을 옮겼습니다. 📌 주제: House Price prediction 📖 참고 솔루션: Stacked Regressions : Top 4% on LeaderBoard(by Serigne) ✔️ Understand the problem ⚡ 변수, 데이터셋 살펴보기 ✏️ 필요한 라이브러리 불러오기 # 라이브러리 불러오기 import numpy as np import pandas as pd # data processing, CSV file I/O import matplotlib.pyplot as plt %matplotlib inline import seaborn as sns color = sns.color_palette() sns.set_style('darkg..

2022년 7월 31일에 velog 블로그에 작성한 글을 옮겼습니다. 📌 주제: House Price exploration 📖 참고 솔루션 Comprehensive data exploration with Python(by Pedro Marcelino) ✔️ Understand the problem ⚡ 변수, 데이터셋 살펴보기 ✏️ 필요한 라이브러리 불러오기 # 라이브러리 불러오기 import pandas as pd import matplotlib.pyplot as plt %matplotlib inline import seaborn as sns import numpy as np from scipy.stats import norm from sklearn.preprocessing import StandardS..

2022년 7월 14일에 velog 블로그에 작성한 글을 옮겼습니다. 📌 주제: titanic 사고로 인한 생존 여부 예측 📖 참고 솔루션 Titanic Data Science Solutions(by MANAV SEHGAL) 📖 순서 1. 문제 정의 2. 훈련, 시험 데이터 준비 3. 데이터 전처리 4. 데이터 분석 5. 모델링 및 예측 ※ 위 순서는 조금씩 바뀌거나 서로 결합될 수 있음 ✔️ 문제 정의 1912년 4월 15일, 타이타닉 호가 빙산과 충돌하여 침몰함 당시 전체 2,224명의 승객 중 1,502명이 사망함 (생존율: 32%) 특정 집단(여성, 어린이 등)이 다른 집단에 비해 비교적 생존율이 높았음 목표: 타이타닉 호 승객 정보를 이용해, 타이타닉 사고로 인한 생존 여부를 예측함 ✔️ 훈련,..