如何过滤HTTP get响应?

时间:2012-09-06 12:16:40

标签: java http-get

我已经学会了如何创建HTTP Get请求方法来从URL中检索数据,但我想过滤响应只给我一个网页上的链接列表。

例如,如果HTML包含以下文本:

<link href="http://www.thompsons.co.uk">

然后打印出来:

http://www.thompsons.co.uk

3 个答案:

答案 0 :(得分:1)

我强烈建议您不要使用正则表达式“解析”HTML。除非您可以控制正在处理的网页的格式,否则基于正则表达式的解决方案可能很脆弱且容易出错。

相反,请使用允许的HTML解析器。本课题提供了许多替代方案:HTML/XML Parser for Java

答案 1 :(得分:0)

您完全读取整个数据,然后使用正则表达式解析它以提取链接。在此处阅读更多内容:http://www.mkyong.com/regular-expressions/how-to-extract-html-links-with-regular-expression/

答案 2 :(得分:0)