为什么R中的采样与spark中的采样结果不一致

时间:2017-03-06 04:40:16

标签: r apache-spark random dataframe seed

我有一个数据帧,我需要从中获取样本并在spark中执行操作,但即使在设置种子值后,我也没有在每次运行中获得完全相同的样本。 (How can I make my dataframe sample in each run using apache spark) 每当我在R中使用种子值进行采样时,我会在同一数据帧上得到完全相同的样本。

这是预期的行为吗?这也是可以接受的吗?

0 个答案:

没有答案