지하철 호선 분석 시각화

csv 읽어서 데이터프레임으로 변경

import pandas as pd
import matplotlib as mpl
import matplotlib.pyplot as plt

df = pd.read_csv("subway.csv") #  csv 읽어서 데이터프레임으로 변경
df

고유요소 반환 -> 구분할 수 있는 것 -> 지하철 노선명

df['line'].unique() # 고유요소 반환 -> 구분할 수 있는 것 -> 지하철 노선명

호선으로 끝나는 데이터 중 공항철도를 포함하는 것을 제외한 것만 추가하기

filter = df['line'].str.endswith("호선") & ~df['line'].str.contains("공항철도")
df = df[filter] # 호선으로 끝나는 것만 골라내기, 공항철도 포함된 것은 빼기

df['line'].unique()

비율로 이용객 비율 구하기

들어오는 사람보다 나가는 사람이 많으면 이용률이 높다 → 비율이 크다

df['ratio'] = df['out'] / df['in'] # 비율 구해서 ratio 추가
df.head()

Seaborn을 이용한 시각화 → 산포도

import seaborn as sns
sns.stripplot(x = "line", y = "ratio", data = df, jitter = True)

한글 폰트 오류

한글 폰트 오류 해결

import seaborn as sns
sns.set(font="NanumGothic") # 한글 깨지면 추가
sns.stripplot(x = "line", y = "ratio", data = df, jitter = True)