Python查找并计算最常见的链接

时间:2017-11-19 01:50:32

标签: python twitter computer-science data-analysis

我的问题是如何根据推特数据csv文件查找最受欢迎的网络链接及其在特定日期显示的次数。

到目前为止,我已经完成了我的代码:

itb_links = [i[1] for i in itb if "://" in i[1] and '2015-11-16' == i[2][:10]]
toplinks = collections.Counter(itb_links).most_common(1)

for i in toplinks:
    print ("Top web link: "  , i[1])

我无法让我的代码只打印网络链接或计算它出现的次数。

输出应为:

2015-11-16 :
23743 total tweets
Top web link: ('http://pbs.twimg.com/media/CT4p5lOWIAAfS3-.png', 193)

相反,我明白了:

2015-11-16 :
23743 total tweets
Top web link:  RT @lacosacine: \\xa1Tenemos kits de #IntoTheBadlands! Hoy a la2 23:59 llega a AMC y lo celebramos con sorteo.\\n\\xa1RT para participar!  http://pbs.twimg.com/media/CT4p5lOWIAAfS3-.png 165

任何帮助都会很棒!重点是在2015-11-16找到最受欢迎的网站链接,并计算它被推文的次数。谢谢!

0 个答案:

没有答案