Question

我正试图抓取一些新闻网站来提取标题，内容和时间戳等信息。现在，我还要计算在Twitter和Facebook上分享该文章的次数。但是，我无法找到合适的资源来有效地完成它。我正在使用Python 2.7.4和Beautiful Soup4来提取数据并将其转储到.CSV文件中。

Answer 1

像计数查询这样的fackbook：

Getting the Facebook like/share count for a given URL

推特分享计数你可以查看这个

Is there a way to get the twitter share count for a specific URL?

Answer 2

因为你只想从页面中获取喜欢的内容。我建议你使用graphAPI获取喜欢然后使用Beautiful Soup转换它并将其写入文件，你可以读取文件来获取数据。这是我写的脚本的一个例子。

import urllib2
from bs4 import BeautifulSoup 
x = urllib2.urlopen("https://api.facebook.com/method/fql.query?query=select%20like_count%20from%20link_stat%20where%20url=%27https://www.facebook.com/mitrevels?ref=br_tf%27")
soup = BeautifulSoup(x)
y = soup.get_text() 
f = open("write.txt","wr") 
f.write(y) 
f.close()

这只会给我特定页面上的喜欢。您需要做的就是更改网址部分以获取您特定网页上的相似内容。 Twitter也可以使用相同的功能。阅读文档以获得结果。

我怎么能找到使用Python urllib2和漂亮的汤库的任何网页上的推文/ facebook的数量？

2 个答案: