我使用正则表达式模块通过使用此帖子中的改编方法从字符串中获取句子:Extract words surrounding a search word
re.search(r'((keyword)\W+((?:\w+\W+){,22}', sentence)
我的结果列表如下所示:
['AL', 'KHOR\\r\\n<https://www.fleetmon.com/vessels/al-khor-f_0_11569260>', 'departed\\r\\nat']
如何从列表元素中删除url,从元素中间删除\ r \ n? 有没有办法在re.search中排除它比在我搜索后尝试删除它更好?
编辑:网址因个别船舶而异。地址与/ vessel
相同答案 0 :(得分:0)
试试这个:
a=[e.replace("\\r\\n",'').split("<")[0] for e in a]