在Python中有效地分割数据

时间:2015-12-17 14:55:50

标签: python pandas dataframe sframe

考虑以下代码

one, two = sales.random_split(0.5, seed=0)
set_1, set_2 = one.random_split(0.5, seed=0)
set_3, set_4 = two.random_split(0.5, seed=0)

我在此代码中尝试将Sales Sframe(类似于Pandas DataFrame)中的数据随机分成大约4个相等的部分。

什么是Pythonic / Efficient方法来实现这一目标?

1 个答案:

答案 0 :(得分:2)

np.random.seed(0)
np.random.shuffle(arr) # in-place
sets = np.array_split(arr, 4)