Question

我有一个带有评论的数据框，我想获取每个评论中有多少个特定单词。

例如，数据框是这样的：

['good food', 'great staff', 'great food and great staff']

如果我搜索“ great”一词，结果应该是添加的df列：

count
0
1
2

到目前为止，我已经尝试过了，但是没有用：

counter = defaultdict(int)
great = 'great'
with open('Reviews.csv', encoding='UTF-8') as f:
    next(f)  # for skip first row with headers
    for line in csv.reader(f):
        df['Count'] = counter(great)

Answer 1

您似乎没有在任何地方定义df，只是在.csv中循环行。

如果要使用通常称为df的{{3}}，则需要在命令行中使用pip install pandas。然后，您可以使用pandas.DataFrame来获得具有漂亮界面的数据结构。然后，您可以通过为df["name_of_review_col"]下标来获得评论。您可以遍历这些行，在空白处" "中拆分每个评论，并使用Counter()中的collections.Counter，计算每个评论中的所有唯一词。

从Python中选定单词的数据框中获取单词计数

1 个答案: