应用错误收集

当您开始学习机器学习时，经常会感到困惑。

监督学习是机器学习的机器学习任务根据示例输入输出将输入映射到输出的函数对。它从标记的训练数据推断功能，包括一组培训示例。在监督学习中，每个例子是由输入对象（通常是矢量）和所需的输出值（也称为监控信号）。一种监督学习算法分析训练数据并产生推断函数，可用于映射新示例。一个最佳方案将使算法能够正确确定看不见的实例的类标签。这需要学习算法从训练数据推广到看不见的情况一种“合理”的方式（请参见归纳偏差）。

也来自Wikipedia：

无监督学习是机器学习的一个分支，可以从中学习未标记，分类或分类的测试数据。无需回应反馈，无监督学习可以识别数据的共性，并根据是否存在做出反应每个新数据中的这种共性。

K-means聚类算法是无监督学习算法。在无监督学习中，您没有标签，因为您没有尝试预测某些东西。相反，您正在尝试找到一种将具有共同特征的数据点分组在一起的方式来对数据进行聚类的方法。

首先在监督学习中使用测试（通常为validation）集的原因是评估模型的泛化属性，以避免over-fitting。但是，在无监督学习中，由于您不知道数据的实际群集，因此无法对此进行评估。因此，没有必要使用测试集。

在机器学习中训练和测试数据

1 个答案: