我有一个带有评论的数据框,我想获取每个评论中有多少个特定单词。
例如,数据框是这样的:
['good food', 'great staff', 'great food and great staff']
如果我搜索“ great”一词,结果应该是添加的df列:
count
0
1
2
到目前为止,我已经尝试过了,但是没有用:
counter = defaultdict(int)
great = 'great'
with open('Reviews.csv', encoding='UTF-8') as f:
next(f) # for skip first row with headers
for line in csv.reader(f):
df['Count'] = counter(great)
答案 0 :(得分:0)
您似乎没有在任何地方定义df
,只是在.csv
中循环行。
如果要使用通常称为df
的{{3}},则需要在命令行中使用pip install pandas
。然后,您可以使用pandas.DataFrame
来获得具有漂亮界面的数据结构。然后,您可以通过为df["name_of_review_col"]
下标来获得评论。您可以遍历这些行,在空白处" "
中拆分每个评论,并使用Counter()
中的collections.Counter
,计算每个评论中的所有唯一词。