我想要提取url之后的部分:'直到我点击下一个'
基本上,在进行正则表达式时,这就是我得到的url:[*。']但这是错误的,因为我不想在我的匹配中包含url。
从下面的文字中应该有2个匹配给我
df = pd.DataFrame({'x': [1, 1, 2, 2, 1, 1], 'y':[1, 2, 2, 2, 2, 1]})
tuples = df[['x', 'y']].apply(tuple, axis=1)
df['newID'] = pd.factorize( tuples )[0]
我的文字文件看起来像。
{{1}}
答案 0 :(得分:1)
您可以使用
(?<=url:').*?(?=')
(?<=url:')
- url:'
.*?
- 非贪婪的findall (?=')
- 预测结束语'