Python列表中的Python计数元素频率

时间:2016-10-19 19:34:04

标签: python

我想知道是否有办法计算2D python列表中的元素频率。 对于1D列表,我们可以使用

list.count(word)

但如果我有一个清单怎么办?

a = [ ['hello', 'friends', 'its', 'mrpycharm'], 
      ['mrpycharm', 'it', 'is'], 
      ['its', 'mrpycharm'] ]

我可以在这个2D列表中找到每个单词的频率吗?

3 个答案:

答案 0 :(得分:5)

假设我明白你想要什么,

>>> collections.Counter([x for sublist in a for x in sublist])
Counter({'mrpycharm': 3, 'its': 2, 'friends': 1, 'is': 1, 'it': 1, 'hello': 1})

或者,

>>> c = collections.Counter()
>>> for sublist in a:
...     c.update(sublist)
...
>>> c
Counter({'mrpycharm': 3, 'its': 2, 'friends': 1, 'is': 1, 'it': 1, 'hello': 1})

答案 1 :(得分:2)

您可以使用defaultdict

from collections import defaultdict
d = defaultdict(int)
for sublist in a:
    for word in sublist:
        d[word] += 1

答案 2 :(得分:1)

您已经了解list.count()。只需在每个sublistsum中获取字数。例如:

>>> my_word = 'its'
>>> sum(sublist.count(my_word) for sublist in a)
2

如果你想要list中存在的每个单词的频率,那么这里有许多好的答案。或者,如果您想要在没有import的情况下(使用普通dict)执行此操作,您可以执行以下操作:

my_dict = {}
for sublist in a:
    for item in sublist:
        if item not in my_dict:
            my_dict[item] = 0
        my_dict[item] += 1

# Value of my_dict:
{'friends': 1, 'is': 1, 'it': 1, 'its': 2, 'mrpycharm': 3, 'hello': 1}