## 테이블 읽기
enter_df = pd.read_csv('enter_lesson_page_2.csv')
complete_df = pd.read_csv('complete_lesson_dedup_2.csv')
c_sub_df = pd.read_csv('complete_subscription.csv')
## 2개의 lesson 테이블의 필요 하지 않은 컬럼 삭제
complete_df = complete_df.drop(columns = ['device_carrier'])
complete_df = complete_df.drop(columns = ['hour_block'])
enter_df = enter_df.drop(columns = ['hour_block'])
## 3개 테이블 datetime 변환
complete_df['client_event_time'] = pd.to_datetime(complete_df['client_event_time'])
enter_df['client_event_time'] = pd.to_datetime(enter_df['client_event_time'])
c_sub_df['client_event_time'] = pd.to_datetime(enter_df['client_event_time'])
## complete_테이블 컬럼명 정리
complete_df = complete_df.rename(columns={
'content.id': 'content_id',
'lesson.id': 'lesson_id'
})
## 컬럼 항목 정리
common_cols = [
'city',
'country',
'device_family',
'device_type',
'event_type',
'language',
'os_name',
'os_version',
'platform',
'is_free_trial',
'is_trial',
'client_event_time',
'user_id',
'lesson_id',
'content_id',
]
complete_df = complete_df[common_cols]
enter_df = enter_df[common_cols]