考虑以下代码
one, two = sales.random_split(0.5, seed=0)
set_1, set_2 = one.random_split(0.5, seed=0)
set_3, set_4 = two.random_split(0.5, seed=0)
我在此代码中尝试将Sales
Sframe(类似于Pandas DataFrame)中的数据随机分成大约4个相等的部分。
什么是Pythonic / Efficient方法来实现这一目标?
答案 0 :(得分:2)
np.random.seed(0)
np.random.shuffle(arr) # in-place
sets = np.array_split(arr, 4)