如何通过Python将具有两个关联文件的数据集拆分为训练和测试数据集?

时间:2017-10-01 22:48:01

标签: python dataset

例如,我有两个文件,sentences.txt和labels.txt
sentences.txt:

This is a sentence
This is not a sentence
Hello world
Hello world too

labels.txt:

1
1
0
0

labels.txt中的每个数字与在句子中的句子相关联,位于相同的位置。我想随机选择50%进行测试,50%进行训练,似乎我不能像参考in this question那样简单地随机选择.shuffle(数据)。那我怎么能随机拆分数据集呢?感谢。

0 个答案:

没有答案