什么是欠拟合和过拟合? 过拟合

CSDN 这篇文章详细介绍了,可以阅读以下,这里简单概括一下:

合适的拟合程度:泛化能力强,训练样本集准确率高,测试样本集准确率高

欠拟合原因:训练样本数量少、模型复杂度低、参数未收敛就停止训练

欠拟合解决:增加样本数量、增加模型参数,提高模型复杂度、增加训练迭代次数、是否学习率过高

过拟合原因:数据噪声太大、特征较多、模型太复杂

过拟合解决:数据预处理、减少模型参数,降低模型复杂度、增加惩罚因子(正则化


偏差-方差权衡

由上述过拟合和欠拟合的分析可知,我们想要模型达到的一种状态就是不那么过拟合也不那么欠拟合,是一种平衡状态。这里我们就引用到了偏差和方差权衡的概念,用于解释模型在训练数据和测试数据上的表现。

  1. 偏差
  2. 方差

所以,我们想要的是模型同时具有低偏差(在训练数据上拟合较好),也要具有低方差(泛化到测试数据好)。但在实际情况下,二者之间是需要权衡的:


正则化

上面的分析可知,我们想要达到一种平衡状态,也就是偏差和方差的权衡。实际上,如果我们想要实现测试集上的高准确率,也就是在测试集上的误差较小,那么我们就要使模型的方差变小,也就是在训练数据上进行训练的时候,不要过多的学习训练数据的细节和噪声,要学习到一些通用的模式和特征,这样才能提高模型的泛化性。但是这样就会使模型无法完全拟合训练数据的每一个细节,就必然引起在训练集上的误差略微增大。总而言之,就是通过增大训练误差来减少测试集误差。