在Windows 10上使用Python 3.6。
def to_csv():
with open('data_set.csv', 'w', newline='', encoding='utf-8') as csvfile:
translator = str.maketrans('', '', string.punctuation)
writer = csv.writer(csvfile, delimiter=',')
rows = []
for i in range(1, 190):
try:
file = open("false_text_files/" + str(i) + ".txt", "rb")
text = file.read().decode().translate(translator)
except:
continue
row = ['no', text]
rows.append(row)
for u in rows:
print(u[1])
writer.writerow(u)
对于多个条目,文本元素正在拆分并添加到CSV文件的下一行。 e.g。
文本中没有标点符号,所以我无法理解为什么它在两行之间分开。任何可能出现问题的帮助或建议都将不胜感激。
答案 0 :(得分:0)
如果有人发现这个并且遇到同样的问题,我就会解决这个问题。我正在使用microsoft excel来查看csv文件,如果单元格的大小超过某个截止值,它会将行扩展到下一行。
只需在文本编辑器中查看文件即可显示它始终正确存储。所以不要犯我的错误。