我正在处理一个关于机器学习的python代码,我必须随机将100000个样本和分割数据混合到训练和测试集中。我已将数据存储到两个numpy数组中。如果我使用以下命令,则太费时间了。
c=zip(a,b)
np.random.shuffle(c)
a,b = (*c)
其中a
和b
是两个numpy数组。是否有任何有效的方法随机混洗数据然后将其拆分为训练和测试集?有人可以建议一个可以帮助我的python代码吗?
答案 0 :(得分:0)
您可能希望使用scikit learn's cross-validation feature中的db.Url.findOne(...).getAction().getContainer()
功能来实现此目的。