我有两组数据集,其中一组比另一组小得多。出于这个原因,我使用MatLab自举功能来估计较小组的性能。我有使用原始数据的代码,它会生成1000个新的'手段。但是,每次使用多少原始数据点并不清楚。显然,如果使用所有原始数据,将继续生成相同的平均值。
任何人都可以帮我解决这个问题吗?
答案 0 :(得分:0)
Bootstrapping来自替换的采样。您将使用与原始数据相同的点数,但其中一些将重复。然而,有一些引导变体的工作方式略有不同。请参阅https://en.wikipedia.org/wiki/Bootstrapping_(statistics)。