在频繁运行机器学习算法时,在这种情况下,如何为特定数据集选择最佳拟合算法的准确性正在发生变化。
答案 0 :(得分:0)
您绝对应该提供更多详细信息。没有域,模型架构,超参数,就不可能提出任何建议。
我猜您是在因模型准确性的变化而抱怨。我认为您应该为随机参数设置种子,以便在训练不同时间时准确性不会改变,并且可以重现结果。
numpy.random.seed(1)
random.seed(1)
tf.random.set_random_seed(1) # if using tensorflow
答案 1 :(得分:0)
让我们假设,问题是每次我们通过将预测响应与Testdata Dependent值(Y)进行比较来运行准确性时,都使用相同的数据集X(训练)。 如果在运行模型时精度似乎不断变化,那么问题就出在“采样偏差”上(“训练数据”和“测试数据”的划分仍然是一个谜)。
当导入train_test_split函数时,请明智地使用random_state属性,以使测试数据代表总体数据。