新浪微博是一个中国微博网站,我正在做一个抓取项目,涉及获取本网站每个用户的博客帖子数量,
网站的网址:http://blogus.sina.com/gb/hotbloger/#top
在这个页面中,你们可以看到所有用户的列表,点击每个用户,我们将被重定向到相应的博客页面,我想获得每个用户的帖子数(通过查看日期和时间)。
他们正在提供api以获取详细信息 API:http://open.weibo.com/wiki/API%E6%96%87%E6%A1%A3/en
但我没有找到任何api电话来获取这些指定的细节。有没有其他方法来获取细节?或者我们可以直接抓取网站吗? 请帮忙。
答案 0 :(得分:0)
您可以使用API方法2/users/show
获取有关用户的信息。
例如,您提到的页面中的第一个链接是:
http://redirect.sina.com/blogus/u/blog.sina.com.cn/u/1763875377
这是重定向到用户ID 1763875377的页面。因此,您只需调用https://api.weibo.com/2/users/show.json?uid=1763875377
即可返回此用户的帖子数量("statuses_count":1583
)。< / p>
您还可以使用/2/users/counts
端点一次获取多个用户的帖子数量。
执行这些经过身份验证的调用需要访问令牌(基本上,您需要在微博上注册一个应用程序)。