我有兴趣查看网站使用情况,问题类型和堆栈溢出的答案。有没有办法下载所有内容?
我认为用漂亮的汤或类似的选项进行网页抓取,但认为有这么多专家用户可以通过API随时获得这些信息。
答案 0 :(得分:1)
是的,正如您猜测的那样,有一个JSON API,请检查http://blog.stackoverflow.com/2012/09/stack-exchange-api-v2-1/
通过示例获得所有问题:https://api.stackexchange.com/docs/questions
它需要一个程序化浏览器和一个JSON解析器。使用perl,python或ruby非常简单。
fvu在评论中提出的另一个解决方案是解析full snapshot of any stackexchange site