我的文字包含下面的换行符。我想知道是否有可能使用Python的regexp,它会忽略字符串中不存在\n
或\r
之类的换行符?
例如,在文字中:
s = '''Lorem ipsum dolor sit amet,
consectetur adipisicing elit,
sed do eiusmod tempor
incididunt ut labore et dolore'''
通过regexp /sit amet,consectetur adipisicing/
查找应该返回一个匹配。
据我所知,re.MULTILINE在这里不适用和re.DOTALL也因为它只是将dot char视为换行符。就我而言,我不想扩展正则表达式。
注意:我不能修剪换行符,因为必须保存此文本。
答案 0 :(得分:2)
首先:/sit amet,consectetur adipisicing/
不是模式,它是固定的字符序列。如果您允许在单词之间添加换行符,它可能会成为一种模式,但是您需要在正则表达式中对此进行描述。
您可以做的是用\s+
替换模式中的每个空格:
sit\s+amet,\s+consectetur\s+adipisicing
\s
是一个空白字符,包括\r
和\n
,请参阅python.org