用于机器学习的python中的外部数据集学习

时间:2016-12-06 01:58:52

标签: python-3.x machine-learning dataset naivebayes

您好我想使用naivebayesclassifier对数据集进行分类。因为我想使用我从google下载的外部数据集。这个数据集包含一个用于正面评论和负面评论的两个文件夹。每个文件夹包含1000个.txt文件。如何我在我的代码中将此文件作为python中的火车数据集导入。我是机器学习的新手,所以我对此很少了。请帮助我。

1 个答案:

答案 0 :(得分:0)

您可以使用os.listdir,来自(https://docs.python.org/2/library/os.html),例如:

import os
fileList = os.listdir('train_directory')
for file in fileList:
    # add content of file to dataset.