数据采样技术和问题

时间:2018-08-10 00:34:26

标签: machine-learning distribution sample sampling

我对数据采样有些困惑,我应该对采样数据分配什么分布?通常,我是否希望采样数据与整个数据集具有相同的分布?我想知道什么是合理的采样技术和方法?

2 个答案:

答案 0 :(得分:0)

选择采样技术时要考虑许多因素。选择采样技术时,应考虑诸如工作目的或目标,预算,时间甚至样本量等因素。

概率采样技术通常会涉及更多的内容,而非概率采样技术的要求可能会更低。

选择的采样技术对数据的解释以及工作的总体结果有很大的帮助。 这些说明可能很有趣:

Simple Random Sampling and Other Sampling Methods

答案 1 :(得分:0)

我不太了解您的问题,但我会尽力回答。 学生的“ t”分布本质上是一个正态分布(钟形近似),这就是为什么统计程序经常在其中包含学生“ t”分布的统计表达式而不是正态分布。