12. 프로젝트를 마치며 우선 우리의 발표자료는 서울시 교통량 발표자료.pdf - Google Drive 서울시 교통량 발표자료.pdf drive.google.com 에서 확인하실 수 있습니다. 물론 Git에도 올라가 있습니다. pdf의 제작에는 디자인 관련 일을 하시고 계신 팀원분께서 힘써주셨습니다 첫 팀프로젝트로서 느낀 감정과 배울점 내가 잘했던 것과 못했던 것을 정리하는 시간을 가지려고합니다. ㅇ 프로젝트/TEAM_서울시 교통 인프라 분석 2022.11.20
(팀원) 11. 서울시 주차장을 분석해보자. 팀원의 데이터가공내용을 정리하여 올리는 글입니다. 제가 만든 것이 아니기 때문에 설명이 빈약합니다. 데이터 출처 서울시 주차장 확보율 통계 서울시 주차장 확보율 통계> 데이터셋> 공공데이터 | 서울열린데이터광장 (seoul.go.kr) 열린데이터광장 메인 데이터분류,데이터검색,데이터활용 data.seoul.go.kr 서울시 주차장 통계 서울시 주차장 (동별) 통계> 데이터셋> 공공데이터 | 서울열린데이터광장 (seoul.go.kr) 열린데이터광장 메인 데이터분류,데이터검색,데이터활용 data.seoul.go.kr 서울시 불법주정차 단속 현황 통계자료 < 교통 < 서울특별시 (seoul.go.kr) 통계자료 통계자료 news.seoul.go.kr 우선 통계 데이터를 정리하고 가공합니다. import pan.. ㅇ 프로젝트/TEAM_서울시 교통 인프라 분석 2022.11.20
10. 대중교통, 상권, 도로 데이터를 모두 시각화해보자. 이전 글에서 이어지는 내용으로 상권이 있으면 교통인프라가 좋을까의 최종 글입니다. 경고 이 글은 코드가 길고 설명이 빈약합니다. 결과론적으로 설명을 하고 있으며 코드를 해석하기 힘들다면 이해하기 어려울 수 있습니다. import folium import pandas as pd import numpy as np from haversine import haversine from tqdm import tqdm 지도에 그림을 많이 그릴 예정입니다. market_region = pd.read_csv('./2021상권데이터 최종.csv', encoding='EUC-KR') market_region 상권데이터를 가져옵시다. 이걸 한 번 지도에 표시해봅시다. 폴리움에 원을 그리려고 합니다. [김영갑 교수의 상권분석과 .. ㅇ 프로젝트/TEAM_서울시 교통 인프라 분석 2022.11.20
(팀원) 9. 서울시 도로율 분석 및 시각화 팀원의 내용을 정리하는 것이며 상세히 적지 못하는 것을 양해해주시기 바랍니다. 데이터 출처 서울시 도로 현황 (도로율) 통계> 데이터셋> 공공데이터 | 서울열린데이터광장 (seoul.go.kr) 열린데이터광장 메인 데이터분류,데이터검색,데이터활용 data.seoul.go.kr 도로율 데이터를 불러옵시다. import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import numpy as np Seoul_Road = pd.read_csv('./Roadrate.csv') Seoul_Road.head() 연도별 도로율의 변화추이와 도로연장에 대해 알고싶다. for each in ['2015', '2016', '2017', '2018'.. ㅇ 프로젝트/TEAM_서울시 교통 인프라 분석 2022.11.20
(팀원) 8. 서울시와 뉴욕시의 교통사고 데이터 분석 및 시각화 이 글은 팀원이 맡아서 한 주제를 적는 글이며, 제가 자세히 모르기 때문에 상세히 적지 못하는점 양해를 데이터 출처 US Accidents(2016~2021) US Accidents (2016 - 2021) | Kaggle US Accidents (2016 - 2021) A Countrywide Traffic Accident Dataset (2016 - 2021) www.kaggle.com 도로교통공단 교통사고 데이터 (현황) KOROAD OPEN API POTAL KOROAD OPEN API POTAL 공공 데이터 개방 추진 사업의 일환으로 사고다발지정보(11종), 교통안전정보(3종), 사망사고정보(1종), 교통사고통계(1종) 를 개방합니다. taas.koroad.or.kr 데이터에서 필요한 컬럼만 추.. ㅇ 프로젝트/TEAM_서울시 교통 인프라 분석 2022.11.20
7. 서울시 상권데이터를 분석하자. 데이터 출처 1. 서울시 상권 위치 데이터 서울시 우리마을가게 상권분석서비스(상권영역)> 데이터셋> 공공데이터 | 서울열린데이터광장 (seoul.go.kr) 열린데이터광장 메인 데이터분류,데이터검색,데이터활용 data.seoul.go.kr 2. 서울시 상권 추정매출 서울시 우리마을가게 상권분석서비스(상권-추정매출)> 데이터셋> 공공데이터 | 서울열린데이터광장 (seoul.go.kr) 열린데이터광장 메인 데이터분류,데이터검색,데이터활용 data.seoul.go.kr 3. 서울시 상권 개점폐업 서울시 우리마을가게 상권분석서비스(상권-점포)> 데이터셋> 공공데이터 | 서울열린데이터광장 (seoul.go.kr) 열린데이터광장 메인 데이터분류,데이터검색,데이터활용 data.seoul.go.kr 데이터 분석 시작 .. ㅇ 프로젝트/TEAM_서울시 교통 인프라 분석 2022.11.19
6. 서울시 승용차 평균속도 데이터 가공 다시 승용차 데이터 속도 정보 | 서울시 교통정보 시스템 - TOPIS (seoul.go.kr) 속도 정보 | 서울시 교통정보 시스템 - TOPIS 속도정보 안내 서울시 차량통행속도 생성개요 수집기간 : 1년 365일, 24시간 (00~24시) 수집범위 : 서울특별시 505개 도로 총 연장 : 1,471.1km 생성방법 : 수집 ⇒ 가공 ⇒ 제공 - 도시고속도로 : 영상검 topis.seoul.go.kr speed = pd.read_excel('./2019_10_서울시 도로별 통행속도.xlsx') speed 대충 필요없는 컬럼을 날려버리자. speed_processing = speed.drop(['링크아이디', '기능유형구분', '도심/외곽구분', '권역구분'], axis=1) 버스나 지하철처럼 출근시간.. ㅇ 프로젝트/TEAM_서울시 교통 인프라 분석 2022.11.19
5. 서울시 승용차 평균속도 데이터를 통해 가공하고 네비게이션용 지도를 그려보자. 데이터 출처 2019~2022년 서울시 도로별 통행속도 데이터 속도 정보 | 서울시 교통정보 시스템 - TOPIS (seoul.go.kr) 속도 정보 | 서울시 교통정보 시스템 - TOPIS 속도정보 안내 서울시 차량통행속도 생성개요 수집기간 : 1년 365일, 24시간 (00~24시) 수집범위 : 서울특별시 505개 도로 총 연장 : 1,471.1km 생성방법 : 수집 ⇒ 가공 ⇒ 제공 - 도시고속도로 : 영상검 topis.seoul.go.kr 구글 API 및 카카오지도 우선 서울시 도로별 통행속도 데이터를 가져와봅시다. (데이터가 너무 많기 때문에 2019~2022년 10월의 데이터만 가공을 합니다.) speed = pd.read_excel('./서울시 도로별 통행속도.xlsx') speed 저는 파.. ㅇ 프로젝트/TEAM_서울시 교통 인프라 분석 2022.11.19
4. (EDA_프로젝트) 서울시 지하철 데이터로 지하철 노선도를 그려보자. 왜 해가 뜨고 있지 정말 쉽게 끝날줄 알았다. 근데 여기에서 4시간이 흘렸다. 새벽 6시.ㅋㅋ 내일은 지각이 확정이다. 빨리 자고 싶은데, 글안쓰면 잠이 안올거 같아서 글씀 프로젝트랑은 전혀 상관이 없는데 3에서 구한 지하철 위치 좌표로 지하철 노선도를 그려볼까? 이생각이 들었음. 내가 미쳤지 import pandas as pd import folium 가공했던 데이터를 불러와서 보기 편하게 수정함 location = pd.read_csv('./metro_2022_10_location.csv', encoding='EUC-KR') location = location.drop(['사용월', '출근시간(04~09) 승차', '출근시간(07~10) 하차', '퇴근시간(16~20) 승차', '퇴근시간(17~21).. ㅇ 프로젝트/TEAM_서울시 교통 인프라 분석 2022.11.14
3. (EDA_프로젝트) 서울시 지하철 데이터를 수집하고 가공하자. 데이터 수집 서울시 지하철역 위치정보 https://observablehq.com/@taekie/seoul_subway_station_coordinate 서울 지하철역 좌표 아래 station_coordinate에 마우스를 올리면 나오는 왼쪽의 점세개를 누르면 csv,json 파일로 다운 받을 수 있는 메뉴가 나옵니다. data 서울특별시 노선별 지하철역 정보 서울 열린 데이타 광장 한글 인 observablehq.com 서울시 지하철역별 시간대별 승하차 인원 정보 https://data.seoul.go.kr/dataList/OA-12252/S/1/datasetView.do 열린데이터광장 메인 데이터분류,데이터검색,데이터활용 data.seoul.go.kr 데이터 전처리 진행하기 버스데이터를 한 번 처리하.. ㅇ 프로젝트/TEAM_서울시 교통 인프라 분석 2022.11.14
2. (EDA_프로젝트) 서울시 버스 데이터를 수집하고 가공하자. 서울시 공공데이터를 활용해서 정류장별 승하차 인원 수, 정류장의 위치정보를 구해보자. 데이터 수집 서울시 버스정류소 위치정보 서울시 버스정류소 위치정보> 데이터셋> 공공데이터 | 서울열린데이터광장 (seoul.go.kr) 열린데이터광장 메인 데이터분류,데이터검색,데이터활용 data.seoul.go.kr 서울시 버스노선별 정류장별 시간대별 승하차 인원 정보 서울시 버스노선별 정류장별 시간대별 승하차 인원 정보> 데이터셋> 공공데이터 | 서울열린데이터광장 (seoul.go.kr) 열린데이터광장 메인 데이터분류,데이터검색,데이터활용 data.seoul.go.kr 데이터 전처리 진행하기 들어가기전 환경을 꼭 체크해야 합니다. 서울시 공공데이터들의 인코딩은 모두 EUC-KR 입니다. 판다스의 디폴트 인코딩은 UT.. ㅇ 프로젝트/TEAM_서울시 교통 인프라 분석 2022.11.14
1. (EDA_프로젝트) 주제 선정하기 2022년 11월 3일 ~ 2022년 11월 17일까지 진행하는 장기 프로젝트 데이콘 주제 중에 하나인 ㅇㅇ시 교통량을 분석하고 출품하는걸 목표로 4명의 팀원을 소집했지만 프로젝트 시작일(11월3일)에는 이미 신청이 마감되어 버렸다. 그덕분에(?) 오히려 좋아 교통량에 대해 자유롭게 접근하자는 의견들이 많이 생겼고 브레인 스토밍을 통해 다음의 주제를 선정했다. 여기서 왜 이 주제가 탈락했는지 이유를 설명하면서 진행을 하자면 1. 인구 이동을 분석해서 어떤 버스노선 지하철 노선을 추가하는게 좋을지 -> 어디가 붐비고, 어디가 좋은지 분석을 할 수 있다. 그러나 지하철 노선을 만드는 과정에서 데이터 분석의 내용이 아니라 머신러닝쪽으로 가게된다. 2. 인구 이동을 분석해서 버스 노선이나 지하철노선을 변경하는 .. ㅇ 프로젝트/TEAM_서울시 교통 인프라 분석 2022.11.13