从Python中选定单词的数据框中获取单词计数

时间:2019-05-16 19:55:29

标签: python

我有一个带有评论的数据框,我想获取每个评论中有多少个特定单词。

例如,数据框是这样的:

['good food', 'great staff', 'great food and great staff']

如果我搜索“ great”一词,结果应该是添加的df列:

count
0
1
2

到目前为止,我已经尝试过了,但是没有用:

counter = defaultdict(int)
great = 'great'
with open('Reviews.csv', encoding='UTF-8') as f:
    next(f)  # for skip first row with headers
    for line in csv.reader(f):
        df['Count'] = counter(great)

1 个答案:

答案 0 :(得分:0)

您似乎没有在任何地方定义df,只是在.csv中循环行。

如果要使用通常称为df的{​​{3}},则需要在命令行中使用pip install pandas。然后,您可以使用pandas.DataFrame来获得具有漂亮界面的数据结构。然后,您可以通过为df["name_of_review_col"]下标来获得评论。您可以遍历这些行,在空白处" "中拆分每个评论,并使用Counter()中的collections.Counter,计算每个评论中的所有唯一词。