Question

我想要提取url之后的部分：'直到我点击下一个'

基本上，在进行正则表达式时，这就是我得到的url：[*。']但这是错误的，因为我不想在我的匹配中包含url。

从下面的文字中应该有2个匹配给我

df = pd.DataFrame({'x': [1, 1, 2, 2, 1, 1], 'y':[1, 2, 2, 2, 2, 1]})
tuples = df[['x', 'y']].apply(tuple, axis=1)
df['newID'] = pd.factorize( tuples )[0]

我的文字文件看起来像。

{{1}}

Answer 1

您可以使用

(?<=url:').*?(?=')

(?<=url:') - url:'
.*? - 非贪婪的findall
(?=') - 预测结束语'

Regex101 Demo

查找子字符串并匹配，直到出现字符

1 个答案: