如何编写代码来下载tripadvisor数据?

时间:2013-11-29 19:42:14

标签: xml api web-scraping tripadvisor

我正在尝试下载Tripadvisor数据,以便在桌面应用程序中进行离线处理。我发现Tripadvisor有一些API可用,但它们似乎有很多限制(许可证数量有限,它们似乎仅限于在另一个网站上使用结果)。您对如何从Tripadvisor下载数据有任何想法吗? 显然,我可以编写一些代码来下载html页面并将它们作为一般XML文档处理,但它不是我所定义的“快速”......:)

1 个答案:

答案 0 :(得分:0)

如果你最终走了HTML解析器路线,我强烈建议使用ScraperWiki这是一个托管网络抓取服务。还有at least three open source projects on Github谈论这样做。