使用换行符提取文本

时间:2016-08-23 11:30:25

标签: c# regex

我正在使用这种模式

const string ptnBodytext = @"<p>\s*(.+?)\s*</p>";

以便在<p>代码中提取文字。它的工作正常,除了那些带换行符的文本,例如:

<p>
    Lorem ipsum
    second line or
    third one?
</p>

如何更改模式以包含换行符,标签符等?

2 个答案:

答案 0 :(得分:4)

您需要激活dotall模式或:

const string ptnBodytext = @"<p>([\s\S]+?)</p>";

请参阅a demo on regex101.com

答案 1 :(得分:2)

只需删除const string ptnBodytext = @"<p>(.+?)</p>";

即可
{{1}}