机器学习产品 v.s. 机器学习运维

机器学习产品 机器学习运维
了解用户交互和模型需求 部署、维护、运维ML Models
如何构建高效开发机器学习系统的团队和组织 生成机器学习产品的系统实践
产品管理 如何构建基础设施以重复可控地构建模型
最佳实践 大规模实践,团队协作研发系统

AI的主要作用:减少了预测的成本

你的项目是否可以/需要使用ML?

  1. Top1 - Data Availability:
    1. 数据获取是否困难?
    2. 数据标注成本是否昂贵?
    3. 需要多少数据?
    4. 数据是否稳定?
    5. 数据安全是否重要?
  2. Second, Accuracy Requirement:
    1. 预测错误的成本?
    2. 正确样本出现的频率?(生成式模型)
    3. 伦理影响?
  3. Finally, Problem Difficulty:
    1. 问题是否明确定义?
    2. 是否有人研究过类似的问题?(新问题总是充满风险)
    3. 计算资源需求?

ML难以解决的问题

1. 高维、模糊的复杂输出 3D重建、视频预测、对话系统、开放式推荐
2. 可靠性、高精度、高鲁棒 分布外失效、对抗性攻击的鲁棒性、高精度位置估计
3. 泛化性、分布外数据、推理、规划、因果性 自动驾驶边缘案例、小数据

不同定义下的ML产品

Software 2.0 当今软件正在做的,使用ML做得更好
Human-in-the-loop(人机协同) 通过使用ML工具,帮助人类把他们的工作做得更好
Autonomous System 使用ML将人类工作自动化

产品开发中的“数据飞轮”

image.png

Impact feasibility
high low Auto sys
mid mid Human-in-the-loop
low high Software 2.0

ML产品的生命周期

image.png