1. 각 CSV 파일 불러오기

df1 = pd.read_csv('/content/conversion_status.csv')

df2 = pd.read_csv('/content/product_interaction.csv')

df3 = pd.read_csv('/content/user_session_info.csv')# 2. user_id 기준으로 병합 (예: inner join으로 모두 겹치는 user_id만)

merged_df = df1.merge(df2, on='user_id', how='inner').merge(df3, on='user_id', how='inner')# 3. 중복 user_id 찾기 (user_id가 여러 번 나오는 경우)

duplicate_user_ids = merged_df[merged_df.duplicated('user_id', keep=False)]['user_id'].unique()print("중복된 user_id 목록:")

print(duplicate_user_ids)# 혹은 중복 user_id별 행 출력 (중복된 모든 행)

print("중복 user_id별 데이터:")

merged_df[merged_df.duplicated('user_id', keep=False)]

팀원의 코드

interaction_df = pd.read_csv("product_interaction.csv")conversion_df = pd.read_csv("conversion_status.csv")user_df = pd.read_csv("user_session_info.csv")

장바구니 담기 이탈률 : 행동했으나 장바구니에 담지 않은 유저 ÷ 전체 행동 유저
- 리뷰 클릭 후 장바구니에 담은 유저와 리뷰 클릭하지 않고 장바구니에 담은 유저 비교
- 할인 노출된 후 장바구니에 담은 유저와 할인 노출되지 않고 장바구니에 담은 유저 비교
- 리뷰 클릭 + 할인 노출된 후 장바구니에 담은 유저와 둘다 하지 않고 장바구니에 담은 유저 비교