.. Cover Letter

전체 글 207

2. git 사용법 clone , git Graph, branch

이 글은 PinkLab의 강의자료를 바탕으로 작성되었습니다. git clone 실무에 나가면 직접 레포지토리를 작성하는게 아니라 서버에 있는 레포지토리를 가져오는 경우가 많다고 합니다. 일단 깃헙 홈페이지로 이동합니다. 이런식으로 새로운 레포지토리를 하나 작성합니다. 그러면 서버에 만들어진 레포지토리를 로컬로 가져와야합니다. 그럴 때 사용하는 명령어가 git clone입니다. 이 주소를 복사합니다. 토큰을 발급받은 분은 토큰을 넣어주어야 할 것 입니다. 그러면 git bash(윈도우), 터미널(우분투)를 작동시킵니다. 저는 D드라이브에 test 폴더를 만들었습니다. 여기에 방금만든 레포지토리를 연결시킵시다. clone의 장점은git init이 필요가 없습니다. 아까 복사해놓은 주소를 넣고 토큰을 삽입해주..

12. 프로젝트를 마치며

우선 우리의 발표자료는 서울시 교통량 발표자료.pdf - Google Drive 서울시 교통량 발표자료.pdf drive.google.com 에서 확인하실 수 있습니다. 물론 Git에도 올라가 있습니다. pdf의 제작에는 디자인 관련 일을 하시고 계신 팀원분께서 힘써주셨습니다 첫 팀프로젝트로서 느낀 감정과 배울점 내가 잘했던 것과 못했던 것을 정리하는 시간을 가지려고합니다.

(팀원) 11. 서울시 주차장을 분석해보자.

팀원의 데이터가공내용을 정리하여 올리는 글입니다. 제가 만든 것이 아니기 때문에 설명이 빈약합니다. 데이터 출처 서울시 주차장 확보율 통계 서울시 주차장 확보율 통계> 데이터셋> 공공데이터 | 서울열린데이터광장 (seoul.go.kr) 열린데이터광장 메인 데이터분류,데이터검색,데이터활용 data.seoul.go.kr 서울시 주차장 통계 서울시 주차장 (동별) 통계> 데이터셋> 공공데이터 | 서울열린데이터광장 (seoul.go.kr) 열린데이터광장 메인 데이터분류,데이터검색,데이터활용 data.seoul.go.kr 서울시 불법주정차 단속 현황 통계자료 < 교통 < 서울특별시 (seoul.go.kr) 통계자료 통계자료 news.seoul.go.kr 우선 통계 데이터를 정리하고 가공합니다. import pan..

10. 대중교통, 상권, 도로 데이터를 모두 시각화해보자.

이전 글에서 이어지는 내용으로 상권이 있으면 교통인프라가 좋을까의 최종 글입니다. 경고 이 글은 코드가 길고 설명이 빈약합니다. 결과론적으로 설명을 하고 있으며 코드를 해석하기 힘들다면 이해하기 어려울 수 있습니다. import folium import pandas as pd import numpy as np from haversine import haversine from tqdm import tqdm 지도에 그림을 많이 그릴 예정입니다. market_region = pd.read_csv('./2021상권데이터 최종.csv', encoding='EUC-KR') market_region 상권데이터를 가져옵시다. 이걸 한 번 지도에 표시해봅시다. 폴리움에 원을 그리려고 합니다. [김영갑 교수의 상권분석과 ..

(팀원) 9. 서울시 도로율 분석 및 시각화

팀원의 내용을 정리하는 것이며 상세히 적지 못하는 것을 양해해주시기 바랍니다. 데이터 출처 서울시 도로 현황 (도로율) 통계> 데이터셋> 공공데이터 | 서울열린데이터광장 (seoul.go.kr) 열린데이터광장 메인 데이터분류,데이터검색,데이터활용 data.seoul.go.kr 도로율 데이터를 불러옵시다. import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import numpy as np Seoul_Road = pd.read_csv('./Roadrate.csv') Seoul_Road.head() 연도별 도로율의 변화추이와 도로연장에 대해 알고싶다. for each in ['2015', '2016', '2017', '2018'..

(팀원) 8. 서울시와 뉴욕시의 교통사고 데이터 분석 및 시각화

이 글은 팀원이 맡아서 한 주제를 적는 글이며, 제가 자세히 모르기 때문에 상세히 적지 못하는점 양해를 데이터 출처 US Accidents(2016~2021) US Accidents (2016 - 2021) | Kaggle US Accidents (2016 - 2021) A Countrywide Traffic Accident Dataset (2016 - 2021) www.kaggle.com 도로교통공단 교통사고 데이터 (현황) KOROAD OPEN API POTAL KOROAD OPEN API POTAL 공공 데이터 개방 추진 사업의 일환으로 사고다발지정보(11종), 교통안전정보(3종), 사망사고정보(1종), 교통사고통계(1종) 를 개방합니다. taas.koroad.or.kr 데이터에서 필요한 컬럼만 추..

7. 서울시 상권데이터를 분석하자.

데이터 출처 1. 서울시 상권 위치 데이터 서울시 우리마을가게 상권분석서비스(상권영역)> 데이터셋> 공공데이터 | 서울열린데이터광장 (seoul.go.kr) 열린데이터광장 메인 데이터분류,데이터검색,데이터활용 data.seoul.go.kr 2. 서울시 상권 추정매출 서울시 우리마을가게 상권분석서비스(상권-추정매출)> 데이터셋> 공공데이터 | 서울열린데이터광장 (seoul.go.kr) 열린데이터광장 메인 데이터분류,데이터검색,데이터활용 data.seoul.go.kr 3. 서울시 상권 개점폐업 서울시 우리마을가게 상권분석서비스(상권-점포)> 데이터셋> 공공데이터 | 서울열린데이터광장 (seoul.go.kr) 열린데이터광장 메인 데이터분류,데이터검색,데이터활용 data.seoul.go.kr 데이터 분석 시작 ..

6. 서울시 승용차 평균속도 데이터 가공

다시 승용차 데이터 속도 정보 | 서울시 교통정보 시스템 - TOPIS (seoul.go.kr) 속도 정보 | 서울시 교통정보 시스템 - TOPIS 속도정보 안내 서울시 차량통행속도 생성개요 수집기간 : 1년 365일, 24시간 (00~24시) 수집범위 : 서울특별시 505개 도로 총 연장 : 1,471.1km 생성방법 : 수집 ⇒ 가공 ⇒ 제공 - 도시고속도로 : 영상검 topis.seoul.go.kr speed = pd.read_excel('./2019_10_서울시 도로별 통행속도.xlsx') speed 대충 필요없는 컬럼을 날려버리자. speed_processing = speed.drop(['링크아이디', '기능유형구분', '도심/외곽구분', '권역구분'], axis=1) 버스나 지하철처럼 출근시간..

5. 서울시 승용차 평균속도 데이터를 통해 가공하고 네비게이션용 지도를 그려보자.

데이터 출처 2019~2022년 서울시 도로별 통행속도 데이터 속도 정보 | 서울시 교통정보 시스템 - TOPIS (seoul.go.kr) 속도 정보 | 서울시 교통정보 시스템 - TOPIS 속도정보 안내 서울시 차량통행속도 생성개요 수집기간 : 1년 365일, 24시간 (00~24시) 수집범위 : 서울특별시 505개 도로 총 연장 : 1,471.1km 생성방법 : 수집 ⇒ 가공 ⇒ 제공 - 도시고속도로 : 영상검 topis.seoul.go.kr 구글 API 및 카카오지도 우선 서울시 도로별 통행속도 데이터를 가져와봅시다. (데이터가 너무 많기 때문에 2019~2022년 10월의 데이터만 가공을 합니다.) speed = pd.read_excel('./서울시 도로별 통행속도.xlsx') speed 저는 파..

4. (EDA_프로젝트) 서울시 지하철 데이터로 지하철 노선도를 그려보자.

왜 해가 뜨고 있지 정말 쉽게 끝날줄 알았다. 근데 여기에서 4시간이 흘렸다. 새벽 6시.ㅋㅋ 내일은 지각이 확정이다. 빨리 자고 싶은데, 글안쓰면 잠이 안올거 같아서 글씀 프로젝트랑은 전혀 상관이 없는데 3에서 구한 지하철 위치 좌표로 지하철 노선도를 그려볼까? 이생각이 들었음. 내가 미쳤지 import pandas as pd import folium 가공했던 데이터를 불러와서 보기 편하게 수정함 location = pd.read_csv('./metro_2022_10_location.csv', encoding='EUC-KR') location = location.drop(['사용월', '출근시간(04~09) 승차', '출근시간(07~10) 하차', '퇴근시간(16~20) 승차', '퇴근시간(17~21)..

3. (EDA_프로젝트) 서울시 지하철 데이터를 수집하고 가공하자.

데이터 수집 서울시 지하철역 위치정보 https://observablehq.com/@taekie/seoul_subway_station_coordinate 서울 지하철역 좌표 아래 station_coordinate에 마우스를 올리면 나오는 왼쪽의 점세개를 누르면 csv,json 파일로 다운 받을 수 있는 메뉴가 나옵니다. data 서울특별시 노선별 지하철역 정보 서울 열린 데이타 광장 한글 인 observablehq.com 서울시 지하철역별 시간대별 승하차 인원 정보 https://data.seoul.go.kr/dataList/OA-12252/S/1/datasetView.do 열린데이터광장 메인 데이터분류,데이터검색,데이터활용 data.seoul.go.kr 데이터 전처리 진행하기 버스데이터를 한 번 처리하..

2. (EDA_프로젝트) 서울시 버스 데이터를 수집하고 가공하자.

서울시 공공데이터를 활용해서 정류장별 승하차 인원 수, 정류장의 위치정보를 구해보자. 데이터 수집 서울시 버스정류소 위치정보 서울시 버스정류소 위치정보> 데이터셋> 공공데이터 | 서울열린데이터광장 (seoul.go.kr) 열린데이터광장 메인 데이터분류,데이터검색,데이터활용 data.seoul.go.kr 서울시 버스노선별 정류장별 시간대별 승하차 인원 정보 서울시 버스노선별 정류장별 시간대별 승하차 인원 정보> 데이터셋> 공공데이터 | 서울열린데이터광장 (seoul.go.kr) 열린데이터광장 메인 데이터분류,데이터검색,데이터활용 data.seoul.go.kr 데이터 전처리 진행하기 들어가기전 환경을 꼭 체크해야 합니다. 서울시 공공데이터들의 인코딩은 모두 EUC-KR 입니다. 판다스의 디폴트 인코딩은 UT..

1. (EDA_프로젝트) 주제 선정하기

2022년 11월 3일 ~ 2022년 11월 17일까지 진행하는 장기 프로젝트 데이콘 주제 중에 하나인 ㅇㅇ시 교통량을 분석하고 출품하는걸 목표로 4명의 팀원을 소집했지만 프로젝트 시작일(11월3일)에는 이미 신청이 마감되어 버렸다. 그덕분에(?) 오히려 좋아 교통량에 대해 자유롭게 접근하자는 의견들이 많이 생겼고 브레인 스토밍을 통해 다음의 주제를 선정했다. 여기서 왜 이 주제가 탈락했는지 이유를 설명하면서 진행을 하자면 1. 인구 이동을 분석해서 어떤 버스노선 지하철 노선을 추가하는게 좋을지 -> 어디가 붐비고, 어디가 좋은지 분석을 할 수 있다. 그러나 지하철 노선을 만드는 과정에서 데이터 분석의 내용이 아니라 머신러닝쪽으로 가게된다. 2. 인구 이동을 분석해서 버스 노선이나 지하철노선을 변경하는 ..

(SQL_Maker)1. mysql을 이용하여 csv, xlsx파일의 데이터를 쉽게 데이터베이스에 삽입하자.

brainKimDu/SQL_Maker (github.com) GitHub - brainKimDu/SQL_Maker Contribute to brainKimDu/SQL_Maker development by creating an account on GitHub. github.com csv, xlsx 파일을 읽어와 mysql을 이용하여 자동으로 테이블을 만들고 데이터를 저장하는 코드입니다. 사용팁 사용하기전 pandas로 데이터를 가공하시길 바랍니다. 현재 코드는 local로 되어있습니다. AWS의 접속을 원한다면 다음의 동작을 따라합니다. 빨간색 밑줄친 부분을 AWS의 주소로 수정합니다. aws 데이터베이스 유저이름과 비밀번호를 입력하여 접속합니다. 과금이 걱정된다면 localhost의 root으로 접속하면..

8. 순차리스트를 통해 스택 구현하기

스택을 구현해주세요. 1. 순차자료형으로 구현을 해주세요. 스택에 원소를 삽입하는 push 함수를 구현 해주시구요. 스택에 원소를 제거하는 pop 함수를 구현해주세요. top에 있는 원소의 값을 반환하거나 스택의 값을 모두 출력해주세요. 순차자료형의 크기는 100으로 해주세요. 문제풀이 스택이란? 통안에 자료를 넣는 것이라 생각하면된다. 자료를 차곡차곡 쌓아가는 과정이다. 그래서 자료를 쌓는 과정을 push라고 하고, 자료를 삭제하는 과정을 pop 이라고 합니다. 맨 위의 자료는 보이기 때문에 조회를 할 수 있습니다. (제일 처음에 넣었던 자료를 확인하고 싶다면 pop을 통해 모두 빼내어야합니다.) 순차자료형으로 구현한다면 정말 쉽다. 결국 배열 문제이기 때문 구현을 하던 중 들었던 생각이다. 스텍이라는..