查找子字符串并匹配,直到出现字符

时间:2017-09-13 19:58:11

标签: regex

我想要提取url之后的部分:'直到我点击下一个'

基本上,在进行正则表达式时,这就是我得到的url:[*。']但这是错误的,因为我不想在我的匹配中包含url。

从下面的文字中应该有2个匹配给我

df = pd.DataFrame({'x': [1, 1, 2, 2, 1, 1], 'y':[1, 2, 2, 2, 2, 1]})
tuples = df[['x', 'y']].apply(tuple, axis=1)
df['newID'] = pd.factorize( tuples )[0]

我的文字文件看起来像。

{{1}}

1 个答案:

答案 0 :(得分:1)

您可以使用

(?<=url:').*?(?=')
  • (?<=url:') - url:'
  • 的lookbehind
  • .*? - 非贪婪的findall
  • (?=') - 预测结束语'

Regex101 Demo