如何选择最合适的机器学习算法

时间:2019-09-25 06:06:13

标签: python-3.x machine-learning

在频繁运行机器学习算法时,在这种情况下,如何为特定数据集选择最佳拟合算法的准确性正在发生变化。

2 个答案:

答案 0 :(得分:0)

您绝对应该提供更多详细信息。没有域,模型架构,超参数,就不可能提出任何建议。

我猜您是在因模型准确性的变化而抱怨。我认为您应该为随机参数设置种子,以便在训练不同时间时准确性不会改变,并且可以重现结果。

numpy.random.seed(1)
random.seed(1)
tf.random.set_random_seed(1) # if using tensorflow

答案 1 :(得分:0)

让我们假设,问题是每次我们通过将预测响应与Testdata Dependent值(Y)进行比较来运行准确性时,都使用相同的数据集X(训练)。 如果在运行模型时精度似乎不断变化,那么问题就出在“采样偏差”上(“训练数据”和“测试数据”的划分仍然是一个谜)。

当导入train_test_split函数时,请明智地使用random_state属性,以使测试数据代表总体数据。