如何从新浪微博网站获取用户列表及其相应的博文

时间:2014-04-16 05:12:55

标签: php api web-scraping weibo sinaweibo

新浪微博是一个中国微博网站,我正在做一个抓取项目,涉及获取本网站每个用户的博客帖子数量,

网站的网址:http://blogus.sina.com/gb/hotbloger/#top

在这个页面中,你们可以看到所有用户的列表,点击每个用户,我们将被重定向到相应的博客页面,我想获得每个用户的帖子数(通过查看日期和时间)。

他们正在提供api以获取详细信息 API:http://open.weibo.com/wiki/API%E6%96%87%E6%A1%A3/en

但我没有找到任何api电话来获取这些指定的细节。有没有其他方法来获取细节?或者我们可以直接抓取网站吗? 请帮忙。

1 个答案:

答案 0 :(得分:0)

您可以使用API​​方法2/users/show获取有关用户的信息。

例如,您提到的页面中的第一个链接是:

http://redirect.sina.com/blogus/u/blog.sina.com.cn/u/1763875377

这是重定向到用户ID 1763875377的页面。因此,您只需调用https://api.weibo.com/2/users/show.json?uid=1763875377即可返回此用户的帖子数量("statuses_count":1583)。< / p>

您还可以使用/2/users/counts端点一次获取多个用户的帖子数量。

执行这些经过身份验证的调用需要访问令牌(基本上,您需要在微博上注册一个应用程序)。