标签: r apache-spark random dataframe seed
我有一个数据帧,我需要从中获取样本并在spark中执行操作,但即使在设置种子值后,我也没有在每次运行中获得完全相同的样本。 (How can I make my dataframe sample in each run using apache spark) 每当我在R中使用种子值进行采样时,我会在同一数据帧上得到完全相同的样本。
这是预期的行为吗?这也是可以接受的吗?