机器学习udacity

时间:2016-12-08 05:12:07

标签: python machine-learning

这些代码是什么意思?

你可以向我解释一下:

features_train, labels_train, features_test, labels_test = makeTerrainData() 
def submitAccuracy():
    return acc

1 个答案:

答案 0 :(得分:1)

在机器学习开发中,您希望将可用数据拆分为训练/测试集,并在可能的情况下另外设置验证集。您这样做是为了测试过度拟合,并确保您的模型可以推广到看不见的观察结果。最终验证集通常很有用,因为在不知情的情况下,用户通常会尝试在测试分区精度上优化其参数,并且这样做基本上给出了该数据的模型的提示。验证集有助于测试此情况并未发生且您的模型不适合。

只看到提供的代码,train_features可能对应于列车分区中用于开发模型的实际数据。标签是您尝试预测的类别。

测试分区只是可用数据的随机样本。功能/标签与上述相同。

您希望从训练数据中构建模型,并评估测试分区的准确性。

Sebastian Rascka提供了python中机器学习的精彩概述。代码示例和一些解释可以在https://github.com/rasbt/python-machine-learning-book/tree/master/code

找到