HTML类型字符串解析问题!

时间:2011-01-27 15:00:33

标签: java html parsing

<a href="http://www.google.com/map" class="more-link">look at the Google map</a> 

是否有任何解析器可以从<a>代码获取链接(www.google.com/map)?

或者只是编写自定义的最佳方式〜

2 个答案:

答案 0 :(得分:2)

jQuery,例如:

var href = $('a.more-link').attr('href');

答案 1 :(得分:-2)

有许多3种方式的解决方案,但我不确定Java存在哪种解决方案,可能是Java版本中存在HTML敏捷包。

但另一种解决方案是使用正则表达式

/<a\s+[^<]*?href\s*=\s*(?:(['"])(.+?)\1.*?|(.+?))>/

修复了正则表达式以处理评论中建议的问题。

如果您发现需要的不仅仅是正则表达式aproach,请查找一些真正的Java解析器

http://htmlparser.sourceforge.net/

http://jericho.htmlparser.net/docs/index.html

http://jsoup.org/