我正试图抓取一些新闻网站来提取标题,内容和时间戳等信息。现在,我还要计算在Twitter和Facebook上分享该文章的次数。但是,我无法找到合适的资源来有效地完成它。我正在使用Python 2.7.4和Beautiful Soup4来提取数据并将其转储到.CSV文件中。
答案 0 :(得分:0)
像计数查询这样的fackbook:
Getting the Facebook like/share count for a given URL
推特分享计数你可以查看这个
Is there a way to get the twitter share count for a specific URL?
答案 1 :(得分:-2)
因为你只想从页面中获取喜欢的内容。我建议你使用graphAPI获取喜欢然后使用Beautiful Soup转换它并将其写入文件,你可以读取文件来获取数据。 这是我写的脚本的一个例子。
import urllib2
from bs4 import BeautifulSoup
x = urllib2.urlopen("https://api.facebook.com/method/fql.query?query=select%20like_count%20from%20link_stat%20where%20url=%27https://www.facebook.com/mitrevels?ref=br_tf%27")
soup = BeautifulSoup(x)
y = soup.get_text()
f = open("write.txt","wr")
f.write(y)
f.close()
这只会给我特定页面上的喜欢。 您需要做的就是更改网址部分以获取您特定网页上的相似内容。 Twitter也可以使用相同的功能。阅读文档以获得结果。