机器学习模板

模板id:3900

数据拆分步骤,将之前生成或者上传的数据,按比例拆分为训练数据和测试数据,通过使用数据拆分组件完成

模型训练部分,会用到回归,分类或者聚类算法组件,这些组件接收一个csv的输入,输出训练完的模型,以项目中的XGBoost回归为例,首先要指定数据的字段,特征字段(features)以及标识字段(label),如下图:

其次再填写模型的一些参数(参数都有默认值),模型在指定完字段后,即可运行,如下图:

模型预测组件,有两个输入,第一个是数据,第二个就是训练好的模型,输出是预测的结果(CSV形式) 与模型训练组件类似,模型预测组件同样需要指定特征字段和标识字段,同样也可以调整资源使用

将预测的结果与实际结果可视化,形成曲线图,直观比较两者之间的差异。这一步用到了曲线图组件。