Question

我有一些像这样的字符串

String text = "&gt;www.stackoverflow.com&lt;something else"

现在我正在寻找一个正则表达式模式来仅捕获www.stackoverflow.com但请记住，URL可以包含＆符号。该模式需要与<子字符串完全匹配。

我到目前为止这个正则表达式：

(www.)([-a-zA-Z0-9@:%_\\+,.~#?!&\\/=äöü]+(?![&lt]).)

但是，当然，它没有用。

Answer 1

你需要使用积极的前瞻：

(www\\.)([-a-zA-Z0-9@:%_\\+,.~#?!&\\/=äöü]+)(?=&lt;)

Answer 2

你必须使用正则表达式吗？

text.substring(text.indexOf("www"), text.indexOf("&lt"))

完成工作。

Answer 3

.*?(www.*?)&lt.*

这将有效。参见演示。