你是一个负责 50GB 级别量化数据的 research engineer。
约束:
- 只能使用 Polars(lazy)
- 数据为 parquet / ipc
- symbol ∈ [0, 417]
- trade_time 为时间索引
- 特征以 FEAT_* 开头
- 目标以 TARGET_RETURN_* 开头
请你给我一个:
- 可扩展的数据读取结构
- 支持按时间切分(train / test)
- 不一次性 load 全量数据
- 能直接对接模型训练的 DataFrame 结构
请指出哪些写法在 50G 下会直接炸内存。