给学习的算法提供学习的数据集,数据集中的每个样本$x$都有相应的正确答案$y$。再根据这些样本作出预测。


监督学习的两大类型,回归(预测房价)和分类(预测乳腺癌)。
样本$x$没有给算法正确答案$y$来回应数据集中的数据。算法需要在数据中找到某种结构,模式或者有趣的东西,用一个算法将这些特性聚合到一起。
无监督学习的两大类型,聚类算法()和降维技术()
$\hat{y}^{(i)}=f_{w,b}(x^{(i)}) = wx^{(i)} + b$
w 是权重 (斜率)b 是偏置 (截距)
$J(w,b) = \frac{1}{2m} \sum_{i=1}^{m} (\hat{y}^{(i)} - y^{(i)})^2$