将HTML页面存储在字符串中

时间:2013-09-22 14:31:39

标签: java html

我有一个URL,我需要它的HTML。我使用了以下代码。

String url = "http://www.sears.com/search="+keywords;
String jsp = retrieveContent(url);

我注意到字符串jsp的内容与网页的实际源代码不同(当我从浏览器查看源代码时)。我相信当浏览器打开时,正在调用服务器端脚本(或者它正被重定向),并且我看到了这个脚本的输出。你能告诉我一种获取页面实际html文件的方法吗?

您可以查看此链接作为示例。我怎么得到这个pagE的实际html?

http://www.sears.com/search=baby%20strollers

3 个答案:

答案 0 :(得分:0)

HTML页面存储在变量jsp中。 alert(jsp)会显示页面。

答案 1 :(得分:0)

我希望看到retrieveContent方法的代码,如果可能的话 如果你想直接阅读网址的html内容,那么这里有一个很好的例子 http://docs.oracle.com/javase/tutorial/networking/urls/readingURL.html

答案 2 :(得分:0)

有许多html内容报废库可以解决问题,我使用的是JSOUP,JSOUP说:

  

“从URL,文件或字符串中抓取并解析HTML”

JSOUP可能适合您的目的。