我正在开发一个应用程序,我必须检查botw.org上是否存在给定URL的链接。是否有任何免费API可用于检查botw.org或任何其他来源以检查此内容?
谢谢!
答案 0 :(得分:1)
您需要一个抓取工具。自己构建一个(对于小爬行来说是非常简单的!)
对于一个小网站(几千页),您可以在内存中完成所有这些操作。
**使用通常的java URLConnection或commons HTTPClient(v4)来发出请求。
注意:找到您的链接 - 链接可以在网站上以绝对,本地或解析为某些基本href存在。在寻找你的时候,你需要考虑到这一点。最简单的方法是将所有链接转换为绝对形式,注意解析当前页面基础href(如果有)。
Simples。
答案 1 :(得分:0)
您必须抓取网站,解析每个网页的锚点,并测试它们是否与您要查找的内容相符...假设他们没有使用javascript创建链接,很少有人这样做。
标准的XML解析器可以工作,SAX可能是最容易学习的。
答案 2 :(得分:0)