当我们使用10倍交叉验证时,我们是否需要进行重要测试?

时间:2015-06-05 13:02:35

标签: machine-learning cross-validation

通常为了表明我们的结果不是偶然的,我们使用像t检验这样的重要测试。但是当我们使用10倍交叉验证时,我们会学习并测试我们的模态而不是数据集块。我想知道当我们使用10倍交叉验证时,我们是否需要进行t检验?更确切地说,我的意思是何时应该使用10倍交叉验证?

2 个答案:

答案 0 :(得分:1)

当应用于两个正态分布变量的差异时,t检验是一个参数检验,用于估计我们对两个变量具有不同预期的事实的置信度。

10倍交叉验证是一种重采样技术,当我们不知道统计数据的分布时,它可用于估计统计数据中的置信度(例如,但不仅仅是两个随机变量之间的差异)提前(非参数设置)。

通过交叉验证,你不会变得很好并且它很重要'结果,你简单地得到了统计数据的估计分布,其中方差是我们可以拥有的信心的指标。

在构建非参数回归或分类模型时,model selection经常使用交叉验证。

答案 1 :(得分:1)

T-test是对您的数据进行的一种统计测试。假设您正在比较两个数据集,并且您想知道这两个数据集是否彼此显着不同。然后你会做一个t检验。

交叉验证更像是一种评估模型的技术。通常用于确保您的模型不会过度拟合。在构建模型时执行此操作以确保您拥有能够推广到未来数据的模型。这里没有使用任何类型的统计测试。 我希望这有助于你的怀疑。