您好我有以下格式的列表
tweets = ['RT了解AZ如何进一步瞄准逃生途径 个性化乳房癌治疗SABCS14','你知道安大略省吗? 针对被认为是高风险妇女的特殊筛查方案 BreastCancer','预防BreastCancer的食品','PRETTY Infinity Faith Hope乳腺癌RIBBON SIGN皮革编织手链 乳腺癌BreastCancerAwareness']
我刚刚给出了一个列表样本,但它总共有8183个元素。所以现在如果我在列表中选择第一项,我必须将其与列表中的所有其他元素进行比较,如果第一项出现在列表中的任何位置,我需要计算它重复多少次。我尝试了很多方法,但无法达到预期的效果。请提前帮助,谢谢。
我的代码
for x, left in enumerate(tweets1):
print x,left
for y, right in enumerate(tweets1):
print y,right
common = len(set(left) & set(right))
答案 0 :(得分:1)
正如评论中已经指出的那样,您可以使用collections.Counter
来执行此操作。代码将转换为如下所示:
from collections import Counter
tweets = ['RT Find out how AZ is targeting escape pathways to further personalise breastcancer treatment SABCS14',
'Did you know Ontario has a special screening program for women considered high risk for BreastCancer',
'Article Foods That Prevent BreastCancer',
'PRETTY Infinity Faith Hope Breast Cancer RIBBON SIGN Leather Braided Bracelet breastcancer BreastCancerAwareness']
count = Counter(tweets)
for key in Count:
print key, Count[key]
请注意,Counter
基本上是dict
,因此无法保证元素的顺序。