## 테이블 읽기
enter_df = pd.read_csv('enter_lesson_page_2.csv')
complete_df = pd.read_csv('complete_lesson_dedup_2.csv')
c_sub_df = pd.read_csv('complete_subscription.csv')

## 2개의 lesson 테이블의 필요 하지 않은 컬럼 삭제
complete_df = complete_df.drop(columns = ['device_carrier'])
complete_df = complete_df.drop(columns = ['hour_block'])
enter_df = enter_df.drop(columns = ['hour_block'])

## 3개 테이블 datetime 변환
complete_df['client_event_time'] = pd.to_datetime(complete_df['client_event_time'])
enter_df['client_event_time'] = pd.to_datetime(enter_df['client_event_time'])
c_sub_df['client_event_time'] = pd.to_datetime(enter_df['client_event_time'])

## complete_테이블 컬럼명 정리
complete_df = complete_df.rename(columns={
    'content.id': 'content_id',
    'lesson.id': 'lesson_id'
})

## 컬럼 항목 정리
common_cols = [
    'city',
    'country',
    'device_family',
    'device_type',
    'event_type',
    'language',
    'os_name',
    'os_version',
    'platform',
    'is_free_trial',
    'is_trial',
    'client_event_time',
    'user_id',
    'lesson_id',
    'content_id',
]

complete_df = complete_df[common_cols]
enter_df = enter_df[common_cols]