Python正则表达式,IGNORE换行符

时间:2014-01-30 08:26:16

标签: python regex

我的文字包含下面的换行符。我想知道是否有可能使用Python的regexp,它会忽略字符串中不存在\n\r之类的换行符?

例如,在文字中:

s = '''Lorem ipsum dolor sit amet,
consectetur adipisicing elit,
sed do eiusmod tempor
incididunt ut labore et dolore'''

通过regexp /sit amet,consectetur adipisicing/查找应该返回一个匹配。

据我所知,re.MULTILINE在这里不适用和re.DOTALL也因为它只是将dot char视为换行符。就我而言,我不想扩展正则表达式。

注意:我不能修剪换行符,因为必须保存此文本。

1 个答案:

答案 0 :(得分:2)

首先:/sit amet,consectetur adipisicing/不是模式,它是固定的字符序列。如果您允许在单词之间添加换行符,它可能会成为一种模式,但是您需要在正则表达式中对此进行描述。

您可以做的是用\s+替换模式中的每个空格:

 sit\s+amet,\s+consectetur\s+adipisicing

here on Regexr

\s是一个空白字符,包括\r\n,请参阅python.org