有没有办法从堆栈溢出下载所有问题和答案?

时间:2014-12-27 18:27:11

标签: web-scraping information-extraction

我有兴趣查看网站使用情况,问题类型和堆栈溢出的答案。有没有办法下载所有内容?

我认为用漂亮的汤或类似的选项进行网页抓取,但认为有这么多专家用户可以通过API随时获得这些信息。

1 个答案:

答案 0 :(得分:1)

是的,正如您猜测的那样,有一个JSON API,请检查http://blog.stackoverflow.com/2012/09/stack-exchange-api-v2-1/

通过示例获得所有问题:https://api.stackexchange.com/docs/questions

它需要一个程序化浏览器和一个JSON解析器。使用非常简单。

fvu在评论中提出的另一个解决方案是解析full snapshot of any stackexchange site