随机抽取数据然后将其拆分为训练和测试集的有效方法?

时间:2017-04-26 09:53:28

标签: python-2.7 python-3.x

我正在处理一个关于机器学习的python代码,我必须随机将100000个样本和分割数据混合到训练和测试集中。我已将数据存储到两个numpy数组中。如果我使用以下命令,则太费时间了。

c=zip(a,b)
np.random.shuffle(c)
a,b = (*c)

其中ab是两个numpy数组。是否有任何有效的方法随机混洗数据然后将其拆分为训练和测试集?有人可以建议一个可以帮助我的python代码吗?

1 个答案:

答案 0 :(得分:0)

您可能希望使用scikit learn's cross-validation feature中的db.Url.findOne(...).getAction().getContainer() 功能来实现此目的。