正则表达式有多余的斜杠

时间:2018-12-11 22:54:40

标签: python regex

这是我用来尝试被两个字符串分开的代码行。

TreeSet

这是我要分割的字符串。

name = str(re.search(r'/(?<=currencies\/)([^/])+(?=\/#markets|$)/', str(tag)).group(0))

我得到<a href="/currencies/ripple/#markets" class="price" data-usd="0.303049255753" data-btc="8.78557136457e-05">$0.303049</a> ,但我只想要/ripple/。 我知道我可以只使用ripple,但我正在尝试学习正则表达式,因此,如果有人可以将我指向正确的方向,将不胜感激。

1 个答案:

答案 0 :(得分:3)

您需要将+修饰符放入捕获组内(而不是外部),然后选择组1而不是0:

>>> re.search(r'/(?<=currencies\/)([^/]+)(?=\/#markets|$)/', str(tag)).group(1)
'ripple'