我正在试图弄清楚如何在远程应用程序或服务器上找到URL的基础。例如,网址可以是: http://www.server.com/app/something/else/page.html
现在绝对基础可能是www.server.com,www.server.com / app或者不到page.html。 Base取决于如何在web.xml中配置应用程序,以及它是否通过apache代理。
我需要知道这些信息,因为我正在将url内容作为客户端阅读,我需要知道如何处理从页面中找到的各种相关内容。
任何暗示都会受到赞赏......
答案 0 :(得分:1)
这不可能确定为客户端,因为您唯一知道的服务器是URL,服务器可以在内部以任意数量的方式配置,与返回到您的请求的HTML内容无关。
如果您需要像浏览器一样抓取网站,则应遵循相同链接时的相同规则。作为客户端,您不能假设服务器没有告诉您的服务器。