我几乎是机器学习的新手。我有一个生物学数据集,例如-
arr = np.stack(your_list)
我正在尝试预测缺少的y值。我为此使用KNN回归。我已经读过,火车测试验证拆分比火车测试拆分然后交叉验证更好。我有一个问题-
我有很多问题。我想通过观看教程来解决这些问题,但无法获得完整的见解。任何帮助将不胜感激。谢谢。
答案 0 :(得分:1)
我会尽力回答您的问题
最后,训练模型的过程或多或少是这样的:
请记住,这只是一个准则,但是要复杂得多。您越会发现这件事。
(*)例如,如果使用几乎相同的样本训练模型,并且测试集由99%相似的样本和1%不同的样本组成,则您将获得99%。可以很多,但是没有用,因为该模型只能预测一个类。因此,请务必视您的情况而定。