正则表达式模式停止在<

时间:2014-09-04 13:57:12

标签: java html regex

我有一些像这样的字符串

String text = ">www.stackoverflow.com<something else"

现在我正在寻找一个正则表达式模式来仅捕获www.stackoverflow.com但请记住,URL可以包含&符号。该模式需要与<子字符串完全匹配。

我到目前为止这个正则表达式:

(www.)([-a-zA-Z0-9@:%_\\+,.~#?!&\\/=äöü]+(?![&lt]).)

但是,当然,它没有用。

3 个答案:

答案 0 :(得分:1)

你需要使用积极的前瞻:

(www\\.)([-a-zA-Z0-9@:%_\\+,.~#?!&\\/=äöü]+)(?=<)

RegEx Demo

答案 1 :(得分:1)

你必须使用正则表达式吗?

text.substring(text.indexOf("www"), text.indexOf("&lt")) 

完成工作。

答案 2 :(得分:0)

.*?(www.*?)&lt.*

这将有效。参见演示。

http://regex101.com/r/oO8zI4/4