서울교통공사_지하철혼잡도정보
주요 정보 개요 서울 지하철 1~8호선 전 역사의 시간대별, 요일별, 상하행선별 혼잡도를 30분 단위로 측정한 데이터
호선 지하철 노선 번호 (1호선~8호선)
역 번호 각 역에 할당된 고유 번호
역명 지하철 역의 이름
방면 해당 노선의 운행 방향을 나타냅니다. (예: 상행(←), 하행(→))
시간대별 혼잡도 30분 간격으로 새벽 5시 30분부터 다음날 0시 30분까지의 혼잡도를 나타내는 수치 데이터
시간대 05:30~00:30
요일 구분 평일, 토요일, 일요일
혼잡도 수치 정원 대비 승치 인원 비율(%), 예: 154.8 = 정원의 1.5배 탑승
컬럼 호선, 역번호, 상하구분(상선/하선, 내선/외선), 시간대(30분 단위)
서울교통공사_환승역 환승인원정보
주요 정보 개요 환승역에서 노선을 갈아타는 '환승 유입 인원' 집계 데이터(승하차 인원이 아닌, 역사 내부 이동 인원)
주요 환승역 신도림, 사당, 잠실, 서울역(사당역, 신도림역 등 15만~27만 명에 육박)
역 개수 총 73개
호선 호선 정보 없음
요일 정보 평일/토요일/일요일
컬럼 환승역 73개, 평일, 토요일, 일요일
지하철 운행현황 통계
주요 정보 개요 노선별(1호선~9호선) 거시적인 운영 현황을 보여주는 통계 지표
호선 1-8호선, 9호선, 우이신설, 신림선, 경의선
수송 인원 연간 총 수송 인원 및 1일 평균 수송 인원
최대 혼잡도 해당 노선의 최고 혼잡도 수치
운행 규모 영업 거리, 역 개수, 평일 운행 횟수
컬럼 운행노선및구간, 영업거리, 역수, 평일운행회수, 연간총수송인원, 1일평균수송인원, 최대혼잡도
서울시 지하철 호선별 역별 시간대별 승하차 인원 정보
주요 정보

지하철 관련 파일 (위에 언급한 4종) EDA 링크

https://colab.research.google.com/drive/1KDdzId8WltRtvN52wXEijDgT_L2cWnkE#scrollTo=iQY-hpxQj-7r

EDA 순서 사고 흐름 내용 데이터 전처리
1. 지하철 혼잡도 정보 어떤 파일인가? 파일 검토 기본 전처리
(결측치 등)
현재 데이터로 볼 수 있는 다양한 시각화 작업 데이터 시각화 * 30분 간격 지하철 평균 혼잡도(막대그래프)

EDA 결과 몇 가지 유용한 정보

  1. 가장 높은 혼잡도 상위 5개 역 정보 요일구분: 평일, 출발역: 사당, 시간: 9시00분, 혼잡도: 154.8 요일구분: 평일, 출발역: 사당, 시간: 8시30분, 혼잡도: 148.0 요일구분: 평일, 출발역: 몽촌토성, 시간: 8시30분, 혼잡도: 147.9 요일구분: 평일, 출발역: 방배, 시간: 8시30분, 혼잡도: 143.4 요일구분: 평일, 출발역: 동대문, 시간: 8시30분, 혼잡도: 141.9

  2. 평일 오전 9시 기준 최고 혼잡도 상위 10개 역

요일구분 출발역 호선 시간 혼잡도
평일 사당 2 9시00분 154.8
평일 방배 2 9시00분 141.6
평일 군자 7 9시00분 136.7
평일 어린이대공원 7 9시00분 136.1
평일 서초 2 9시00분 136.0
평일 낙성대 2 9시00분 134.2
평일 중곡 7 9시00분 130.0
평일 용마산 7 9시00분 125.7
평일 교대 2 9시00분 125.3
평일 서울대입구 2 9시00분 124.9
  1. 평균 혼잡도 상위 30개 역

    평균 혼잡도 상위 30개 역.png

  2. 환승인원 상위 5개역 요일별 비교

    환승인원 상위 5개 역 요일별 환승인원.png

  3. 환승 상위 5개역 요일별 평균 혼잡도 비교

    환승 상위 5개역 요일별 평균 혼잡도.png

  4. 시간대별 지하철 평균 혼잡도

    시간대별 평균 지하철 혼잡도.png

  5. 지하철 혼잡도 기준 (출처 : 서울메트로)