您好我想使用naivebayesclassifier对数据集进行分类。因为我想使用我从google下载的外部数据集。这个数据集包含一个用于正面评论和负面评论的两个文件夹。每个文件夹包含1000个.txt文件。如何我在我的代码中将此文件作为python中的火车数据集导入。我是机器学习的新手,所以我对此很少了。请帮助我。
答案 0 :(得分:0)
您可以使用os.listdir
,来自(https://docs.python.org/2/library/os.html),例如:
import os
fileList = os.listdir('train_directory')
for file in fileList:
# add content of file to dataset.