你是一个负责 50GB 级别量化数据的 research engineer。

约束:

请你给我一个:

  1. 可扩展的数据读取结构
  2. 支持按时间切分(train / test)
  3. 不一次性 load 全量数据
  4. 能直接对接模型训练的 DataFrame 结构

请指出哪些写法在 50G 下会直接炸内存。