我想知道是否有办法计算2D python列表中的元素频率。 对于1D列表,我们可以使用
list.count(word)
但如果我有一个清单怎么办?
a = [ ['hello', 'friends', 'its', 'mrpycharm'],
['mrpycharm', 'it', 'is'],
['its', 'mrpycharm'] ]
我可以在这个2D列表中找到每个单词的频率吗?
答案 0 :(得分:5)
假设我明白你想要什么,
>>> collections.Counter([x for sublist in a for x in sublist])
Counter({'mrpycharm': 3, 'its': 2, 'friends': 1, 'is': 1, 'it': 1, 'hello': 1})
或者,
>>> c = collections.Counter()
>>> for sublist in a:
... c.update(sublist)
...
>>> c
Counter({'mrpycharm': 3, 'its': 2, 'friends': 1, 'is': 1, 'it': 1, 'hello': 1})
答案 1 :(得分:2)
您可以使用defaultdict
:
from collections import defaultdict
d = defaultdict(int)
for sublist in a:
for word in sublist:
d[word] += 1
答案 2 :(得分:1)
您已经了解list.count()
。只需在每个sublist
和sum
中获取字数。例如:
>>> my_word = 'its'
>>> sum(sublist.count(my_word) for sublist in a)
2
如果你想要list
中存在的每个单词的频率,那么这里有许多好的答案。或者,如果您想要在没有import
的情况下(使用普通dict
)执行此操作,您可以执行以下操作:
my_dict = {}
for sublist in a:
for item in sublist:
if item not in my_dict:
my_dict[item] = 0
my_dict[item] += 1
# Value of my_dict:
{'friends': 1, 'is': 1, 'it': 1, 'its': 2, 'mrpycharm': 3, 'hello': 1}