创建一个包含两列的csv文件计数器模式

时间:2016-11-10 15:43:37

标签: python python-3.x csv counter

我编写了一个代码,用于计算给定文本文档中单词的出现次数,现在我想将输出保存在带有两列的csv文件中:一列用于单词,一列用于它们的频率。

这是我想要复制的代码:

from collections import Counter
counter = Counter(['spam', 'egg', 'spam', 'egg', 'python', 'egg'])

with open('wordfile.csv', 'w') as f:
    writer = csv.writer(f, delimiter=' ')
    writer.writerow(('word', 'count'))
    writer.writerows(counter.most_common())     

然而,这是输出:

word countegg 3spam 2python 1

我想要获得的输出应该只包含两列(一个用于“单词”和一个用于“频率”,每行应该包含一个单词及其出现在文本中:

word, frequency,
the, 3165,
in, 1265,
of,1233,

当我用代码打印输出时:

print(open('wordfile.csv', 'rb').read())

我明白了:

b'word count\r\r\negg 3\r\r\nspam 2\r\r\npython 1\r\r\n')

正如您所看到的,这个词和频率没有两列。 我正在使用Windows,这是我正在使用的Python版本: 3.5.2 | Anaconda 4.1.1(64位)

1 个答案:

答案 0 :(得分:2)

writer.writerow期待该行的列列表;在你的片段中你传递了所有的结果,即。所有项目的所有列。

你需要通过counter.items()来获得你想要的结果:

import csv
from collections import Counter

counter = Counter(['spam', 'egg', 'spam', 'egg', 'python', 'egg'])

with open('wordfile.csv', 'w', newline='') as f:
    writer = csv.writer(f, delimiter=' ')
    writer.writerow(('word', 'count'))
    writer.writerows(counter.most_common())