我已经学会了如何创建HTTP Get请求方法来从URL中检索数据,但我想过滤响应只给我一个网页上的链接列表。
例如,如果HTML包含以下文本:
<link href="http://www.thompsons.co.uk">
然后打印出来:
答案 0 :(得分:1)
我强烈建议您不要使用正则表达式“解析”HTML。除非您可以控制正在处理的网页的格式,否则基于正则表达式的解决方案可能很脆弱且容易出错。
相反,请使用允许的HTML解析器。本课题提供了许多替代方案:HTML/XML Parser for Java
答案 1 :(得分:0)
您完全读取整个数据,然后使用正则表达式解析它以提取链接。在此处阅读更多内容:http://www.mkyong.com/regular-expressions/how-to-extract-html-links-with-regular-expression/
答案 2 :(得分:0)