Question

我已经学会了如何创建HTTP Get请求方法来从URL中检索数据，但我想过滤响应只给我一个网页上的链接列表。

例如，如果HTML包含以下文本：

<link href="http://www.thompsons.co.uk">

然后打印出来：

Answer 1

我强烈建议您不要使用正则表达式“解析”HTML。除非您可以控制正在处理的网页的格式，否则基于正则表达式的解决方案可能很脆弱且容易出错。

相反，请使用允许的HTML解析器。本课题提供了许多替代方案：HTML/XML Parser for Java

Answer 2

您完全读取整个数据，然后使用正则表达式解析它以提取链接。在此处阅读更多内容：http://www.mkyong.com/regular-expressions/how-to-extract-html-links-with-regular-expression/

Answer 3

你可以使用jsoup：