我有一个字符串列表,其中一些是相同的。我需要一些可以计算相同字符串的脚本。例如:
我有一个单词列表:
“家”
“红楼梦”
“树”
“树”
“豪斯医生”
“天空”
“家”
输出应如下所示:
“众议院” - 3
“树” - 2
“梦想” - 1
等等
答案 0 :(得分:7)
使用collections.Counter()。它专为这个用例而设计:
>>> import collections
>>> seq = ["House", "Dream", "Tree", "Tree", "House", "Sky", "House"]
>>> for word, cnt in collections.Counter(seq).most_common():
print repr(word), '-', cnt
'House' - 3
'Tree' - 2
'Sky' - 1
'Dream' - 1
答案 1 :(得分:4)
这很简单(words
是您要处理的单词列表):
result = {}
for word in set(words):
result[word] = words.count(word)
它不需要任何额外的模块。
对于以下words
值:
words = ['House', 'Dream', 'Tree', 'Tree', 'House', 'Sky', 'House']
它会给你以下结果:
>>> result
{'Dream': 1, 'House': 3, 'Sky': 1, 'Tree': 2}
它能回答你的问题吗?
答案 2 :(得分:3)
from collections import defaultdict
counts = defaultdict(int)
for s in strings:
counts[s] += 1
for (k, v) in counts.items():
print '"%s" - %d' % (k, v)
答案 3 :(得分:2)
我将扩展Tadeck的答案来打印结果。
for word in set(words):
print '''"%s" - %d''' %(word, words.count(word))
答案 4 :(得分:1)
下面的代码可以让您按预期进行
stringvalues = ['House', 'Home', 'House', 'House', 'Home']
for str in stringvalues:
if( str in newdict ):
newdict[str] = newdict[str] + 1
else:
newdict[str] = 1
all = newdict.items()
for k,v in all:
print "%s-%s" % (k,v)