我怎么能找到使用Python urllib2和漂亮的汤库的任何网页上的推文/ facebook的数量?

时间:2013-12-06 08:16:44

标签: python beautifulsoup

我正试图抓取一些新闻网站来提取标题,内容和时间戳等信息。现在,我还要计算在Twitter和Facebook上分享该文章的次数。但是,我无法找到合适的资源来有效地完成它。我正在使用Python 2.7.4和Beautiful Soup4来提取数据并将其转储到.CSV文件中。

2 个答案:

答案 0 :(得分:0)

像计数查询这样的fackbook:

Getting the Facebook like/share count for a given URL

推特分享计数你可以查看这个

Is there a way to get the twitter share count for a specific URL?

答案 1 :(得分:-2)

因为你只想从页面中获取喜欢的内容。我建议你使用graphAPI获取喜欢然后使用Beautiful Soup转换它并将其写入文件,你可以读取文件来获取数据。 这是我写的脚本的一个例子。

import urllib2
from bs4 import BeautifulSoup 
x = urllib2.urlopen("https://api.facebook.com/method/fql.query?query=select%20like_count%20from%20link_stat%20where%20url=%27https://www.facebook.com/mitrevels?ref=br_tf%27")
soup = BeautifulSoup(x)
y = soup.get_text() 
f = open("write.txt","wr") 
f.write(y) 
f.close() 

这只会给我特定页面上的喜欢。 您需要做的就是更改网址部分以获取您特定网页上的相似内容。 Twitter也可以使用相同的功能。阅读文档以获得结果。