计算文字中的单词并按分组

时间:2019-03-10 15:49:19

标签: python csv methods group-by count

我的任务是必须编写一个程序,在其中创建一个包含两个标题的表:

WORD     ||    FREQUENCY

所有单词都必须在标题WORD下。这些单词的频率必须在标题FREQUENCY

我创建了带有标题的表,并且所有单词都在标题单词下。我的问题是计算这些单词。

这是我的代码:

newresult = result.split()
myFile = open('table.csv','w') 

with myFile:
 writer = csv.writer(myFile)
 writer.writerow(["WORD","FREQUENCY"])
 for t in newresult:
   writer.writerow({t})

整个文本保存在newresult中。现在我必须数这几个字。

现在的外观示例:

WORD                     FREQUENCY

Hello

my 

Name

is

John

Hello

Guys

我不知道该如何计算这些单词。

1 个答案:

答案 0 :(得分:0)

好的,您已经完成了newresult = result.split(),该操作将字符串result拆分为单个单词列表。那是工作的一半。现在,您只需要计算每个单词。

首先,以 just 唯一的单词。您可以通过创建一个 set

uniques = set(newresult)

然后,遍历唯一性,并使用newresult查找每个在newresult.count()中的代表次数:

...
for word in uniques:
    writer.writerow([word, newresult.count(word)])