我正在使用这个Python(2.7)代码,分析.txt文件中50个最常用的单词。下一步是将单词及其出现次数导出到.csv文件。我正在导出到.csv文件,但代码会使用标点符号和括号对单词及其数字进行分组。我需要两列,每一组都在一个新行上。
例如:('',329)需要显示为两个不同的列,| 329
我想我可以使用正则表达式来解决它,但我真的不知道如何。任何帮助表示赞赏。
import re
import collections
import csv
from collections import Counter
words = re.findall('\w+', open('document.txt').read().lower())
thing = Counter(words).most_common(50)
PDFiles = "PDFiles.csv"
with open(PDFiles, "w") as output:
writer = csv.writer(output, lineterminator='\n')
for val in thing:
writer.writerow(val) # edited
使用最新编辑时,文本显示为
tell | 329
0| 65
答案 0 :(得分:0)
试试这个
writer.writerow([VAL [0],VAL [1]])