취업전 프로젝트/TEAM_서울시 교통 인프라 분석
(팀원) 8. 서울시와 뉴욕시의 교통사고 데이터 분석 및 시각화
BrainKimDu
2022. 11. 20. 00:29
이 글은 팀원이 맡아서 한 주제를 적는 글이며, 제가 자세히 모르기 때문에 상세히 적지 못하는점 양해를
데이터 출처
US Accidents(2016~2021)
US Accidents (2016 - 2021) | Kaggle
US Accidents (2016 - 2021)
A Countrywide Traffic Accident Dataset (2016 - 2021)
www.kaggle.com
도로교통공단 교통사고 데이터 (현황)
KOROAD OPEN API POTAL
공공 데이터 개방 추진 사업의 일환으로 사고다발지정보(11종), 교통안전정보(3종), 사망사고정보(1종), 교통사고통계(1종) 를 개방합니다.
taas.koroad.or.kr
데이터에서 필요한 컬럼만 추출하는 과정입니다.
import pandas as pd
import matplotlib.pyplot as plt
US_Acc = pd.read_csv('./US_Accidents_Dec21_updated.csv')
US_Acc.head()
발생시간 및 위치정보만 뽑아냅니다.
US_S = US_Sev.iloc[:,[1,2, 4, 5, 13]]
US_S.head()
발생시간에서 연도를 뽑아냅니다.
US_S["Start_Time"] = US_S["Start_Time"].str[:4]
뉴욕만 궁금하기 때문에
US_A = US_A[US_A.City == 'New York']
US_A
뉴욕만 뽑아냅니다.
m = folium.Map(location = [40.8, -73.95])
NY_2021 = pd.read_csv('../../PJT_1_Data/NY_2021_Acc.csv')
for idx, row in NY_2021.iterrows():
folium.Marker([row["1"], row["2"]]).add_to(m)
m
위험도가 높은 교통사고들을 지도에 찍었을 때 (2021년만)
뉴욕의 경우 큰 길가에 사고가 집중되어 있습니다.
이제 서울의 교통사고 데이터를 살펴봅시다.
Kor_Acc = pd.read_csv('../../data/PJT_1_Data/도로교통공단_사망 교통사고 정보_20211231.csv',encoding='euc-kr')
Kor_Acc.head()
Kor_A = Kor_Acc.iloc[:,[0, 9, 21, 22]]
Kor_A.head()
원하는 컬럼 (위치정보와 연도)를 추출합니다.
이를 폴리움으로 지도에 찍어보면
m = folium.Map(location = [37.33, 126.59])
for idx, row in Seoul_2021.iterrows():
folium.Marker([row["3"], row["2"]]).add_to(m)
m
서울의 경우 사고가 산발적으로 일어납니다.