正则表达式,提取编号列表(多行)

时间:2013-03-28 09:39:20

标签: c# regex

我收到了以下文字:

1. This is a text
where each item can span over multiple lines
2. that I want to
extract each seperate
item from
3. How can I do that?

我在改装中尝试了这个正则表达式:

/([\d]+\.)(.*)/s

但我不确定它是否贪婪(只返回一个项目)或是否提取所有项目。但是当我在C#中尝试时,正则表达式与任何东西都没有匹配。

我做错了什么?

更新

虽然\s似乎无法在.NET中运行,但它已经完成但无效。我自己可以修复线条结尾(因为它们被剥离)。但是如何使正则表达式不贪婪?可以说像

这样的话

匹配数字+点然后除了下一个数字+点之外的所有内容?

1 个答案:

答案 0 :(得分:4)

string input = @"1. This is a text
    where each item can span over multiple lines
    2. that I want to
    extract each seperate
    item from
    3. How can I do that?";
string pattern = @"([\d]+\. )(.*?)(?=([\d]+\.)|($))";
var matches = Regex.Matches(input, pattern, RegexOptions.Singleline);

foreach(Match match in matches)
{
    Console.WriteLine(match.Groups[2].Value);
}