我正在尝试下载Tripadvisor数据,以便在桌面应用程序中进行离线处理。我发现Tripadvisor有一些API可用,但它们似乎有很多限制(许可证数量有限,它们似乎仅限于在另一个网站上使用结果)。您对如何从Tripadvisor下载数据有任何想法吗? 显然,我可以编写一些代码来下载html页面并将它们作为一般XML文档处理,但它不是我所定义的“快速”......:)
答案 0 :(得分:0)
如果你最终走了HTML解析器路线,我强烈建议使用ScraperWiki这是一个托管网络抓取服务。还有at least three open source projects on Github谈论这样做。