如何只用Java获取页面的HTML内容?

时间:2017-07-11 11:52:16

标签: java html url

不使用任何外部库,将网站的HTML内容提取到字符串中的最简单方法是什么?我曾尝试过,但我获得了完整的页面源代码,但我只想要HTML内容。

1 个答案:

答案 0 :(得分:0)

我发现在没有使用外部库的情况下实现这个我的朋友有点困难。

您实际上想要执行Html的javascript部分,并且像无GUI的Web浏览器程序一样。

如果您要使用外部库,我会选择http://htmlunit.sourceforge.net/非常简单。