negids = movie_reviews.fileids('neg')
posids = movie_reviews.fileids('pos')
for f in negids:
with open(fileids=[f], "rb") as infile, open(fileids=[f], 'wb') as outfile:
in_txt = csv.reader(infile, delimiter = '\t')
out_csv = csv.writer(outfile)
out_csv.writerow(in_txt)
任何人都可以帮忙,我正在尝试阅读电影评论语料库的neg文件夹中的每个文件,并希望在Excel工作表中插入该文件的完整数据
答案 0 :(得分:0)
使用csv DictReader。
import csv
import json
data = csv.DictReader(open('filename.csv', 'r'))
print data.fieldnames
for each in data:
row ={}
# check condition code here
output.append(row)
print output
将输出数据添加到csv文件
答案 1 :(得分:0)
directory = raw_input("INPUT Folder:")
output = raw_input("OUTPUT Folder:")
txt_files = os.path.join(directory, '*.txt')
for txt_file in glob.glob(txt_files):
with open(txt_file, "rb") as input_file:
in_txt = csv.reader(input_file)
filename = os.path.splitext(os.path.basename(txt_file))[0] + '.csv'
with open("book.csv", 'wb') as output_file:
out_csv = csv.writer(output_file)
out_csv.writerows(in_txt)
我试过这个代码它正在运行,但问题是电影评论语料库的neg文件夹中的每个文本文件必须作为csv文件中的一行(即neg文件夹包含千个文件,我希望它新创建的csv应该有一行一行用于一个文本文件的完整文本)但是这不会发生,最后一个文件数据覆盖了以前的文件数据,最后一个文件数据出现在csv文件的多行中