.. Cover Letter

ㅇ 프로젝트/TEAM_서울시 교통 인프라 분석

(팀원) 8. 서울시와 뉴욕시의 교통사고 데이터 분석 및 시각화

BrainKimDu 2022. 11. 20. 00:29

이 글은 팀원이 맡아서 한 주제를 적는 글이며, 제가 자세히 모르기 때문에 상세히 적지 못하는점 양해를


데이터 출처

 

US Accidents(2016~2021)

US Accidents (2016 - 2021) | Kaggle

 

US Accidents (2016 - 2021)

A Countrywide Traffic Accident Dataset (2016 - 2021)

www.kaggle.com

 

 

도로교통공단 교통사고 데이터 (현황)

KOROAD OPEN API POTAL

 

KOROAD OPEN API POTAL

공공 데이터 개방 추진 사업의 일환으로 사고다발지정보(11종), 교통안전정보(3종), 사망사고정보(1종), 교통사고통계(1종) 를 개방합니다.

taas.koroad.or.kr

 


데이터에서 필요한 컬럼만 추출하는 과정입니다.

import pandas as pd
import matplotlib.pyplot as plt
US_Acc = pd.read_csv('./US_Accidents_Dec21_updated.csv')
US_Acc.head()

 

발생시간 및 위치정보만 뽑아냅니다.

US_S = US_Sev.iloc[:,[1,2, 4, 5, 13]]
US_S.head()

발생시간에서 연도를 뽑아냅니다.

US_S["Start_Time"] = US_S["Start_Time"].str[:4]

 

 

 

뉴욕만 궁금하기 때문에

US_A = US_A[US_A.City == 'New York']
US_A

뉴욕만 뽑아냅니다.

 

 

 

m = folium.Map(location = [40.8, -73.95])
NY_2021 = pd.read_csv('../../PJT_1_Data/NY_2021_Acc.csv')

for idx, row in NY_2021.iterrows():
    folium.Marker([row["1"], row["2"]]).add_to(m)

m

위험도가 높은 교통사고들을 지도에 찍었을 때 (2021년만)

 

뉴욕의 경우 큰 길가에 사고가 집중되어 있습니다.

 

 

이제 서울의 교통사고 데이터를 살펴봅시다.

Kor_Acc = pd.read_csv('../../data/PJT_1_Data/도로교통공단_사망 교통사고 정보_20211231.csv',encoding='euc-kr')
Kor_Acc.head()

Kor_A = Kor_Acc.iloc[:,[0, 9, 21, 22]]
Kor_A.head()

 

원하는 컬럼 (위치정보와 연도)를 추출합니다.

 

이를 폴리움으로 지도에 찍어보면

m = folium.Map(location = [37.33, 126.59])
for idx, row in Seoul_2021.iterrows():
    folium.Marker([row["3"], row["2"]]).add_to(m)

m

 

서울의 경우 사고가 산발적으로 일어납니다.