这些代码是什么意思?
你可以向我解释一下:features_train, labels_train, features_test, labels_test = makeTerrainData()
def submitAccuracy():
return acc
答案 0 :(得分:1)
在机器学习开发中,您希望将可用数据拆分为训练/测试集,并在可能的情况下另外设置验证集。您这样做是为了测试过度拟合,并确保您的模型可以推广到看不见的观察结果。最终验证集通常很有用,因为在不知情的情况下,用户通常会尝试在测试分区精度上优化其参数,并且这样做基本上给出了该数据的模型的提示。验证集有助于测试此情况并未发生且您的模型不适合。
只看到提供的代码,train_features可能对应于列车分区中用于开发模型的实际数据。标签是您尝试预测的类别。
测试分区只是可用数据的随机样本。功能/标签与上述相同。
您希望从训练数据中构建模型,并评估测试分区的准确性。
Sebastian Rascka提供了python中机器学习的精彩概述。代码示例和一些解释可以在https://github.com/rasbt/python-machine-learning-book/tree/master/code
找到