tulu3_final_sampled_512to2048.parquet
작은 MergeUp 1차 SFT에서 사용
tulu3_final_sampled_512to1024.parquet
큰 MergeUp 1차 SFT에서 사용
benchs_final_sampled_128to1024.parquet
MergeUp 2차 SFT에서 사용