我想写一篇使用开放数据集的学术论文。我发现这个数据集的作者和一些研究人员使用10倍交叉验证,其他研究人员不知道他们使用了哪种验证和测试方法。所以我不确定应该使用什么。
我可以使用列车测试分割方法与其他纸张的准确度进行比较吗?例如,70%的训练集,15%的验证集和15%的测试集。
答案 0 :(得分:0)
简短的回答是否定的,使用不同的泛化估计不会产生统计上的声音结果。如果作者声称他们使用了10倍交叉验证并且您想要与它们进行比较,则只有两个选项:
请注意,如果2只使用15%的数据点进行评估,那么仅如果您有大量数据(大概是大约70,000点左右,那么15%是实际上是10,000个样本)