在java中,有没有办法获取网页的内容,这是一个.ASPX文件。 我知道如何从普通的HTML页面读取/写入任何内容,但是asp页面似乎有多个页面的URL,因此无法通过URL访问所需的页面。
我知道你不能/不会在这里给我完整的指示,但是你可以向我发送正确的方向吗?
提前致谢。
答案 0 :(得分:2)
与其他任何类型的页面相比,ASPX页面没有什么特别之处; “普通”html页面也可以动态生成。
请不要忘记查询字符串也是URL的一部分。如果没有一些查询字符串值,许多ASPX,PHP等页面甚至可能都不是“正确”的。而其他网站根本没有文件扩展名......就像这个网站本身一样。您只需确保获取每个唯一“页面”的完整网址。
答案 1 :(得分:1)
我不是.asp的专家,所以我可能错了。但是,我的印象是.asp页面应该最终返回HTML(类似于.jsp页面的内容),因此您可以像对HTML页面一样获取内容。
但是,你写的是
asp页面似乎有一个多页面的URL
这让我觉得你的.asp页面可能正在使用AJAX,因此页面内容可能会更改,而URL则不会。这是你的情况吗?
答案 2 :(得分:1)
我知道你试图从客户端PC读取aspx,而不是从服务器读取。
如果这是正确的,访问HTTP资源独立于服务器使用的技术,您只需打开http请求并检索结果。
如果您看到来自一个网址的多个网页,则会发生以下情况之一:
1)POST数据被发送到aspx,并且由于这些参数而呈现不同的HTML
2)您不是真正关注内部页面,而是查看为正在呈现的HTML提供框架的页面
3)页面使用大量Ajax进行渲染。页面的“内容”不是通过初始请求下载,而是稍后通过javascript下载。
一般来说,这可能是第一个原因。