如何使用Regex.Split拆分字符串并保留所有分隔符?
我有一个字符串:" substring1 delimeter1 substring2" ,其中delimeter + substring2是地址的一部分。
此外,我还有2个以上的分界符:delim1,delim2,它们的含义相同;
我想得到像这样的字符串数组:
arr[0]="subsctring1";
arr[1]="delim1 subsctring2";
,或者
arr[1]="delim2 subsctring2;
我有一个模式:
addrArr= Regex.Split(inputText, String.Concat("(?<=",delimeter1, "|",delimeter2, ")"), RegexOptions.None);
但它效果不佳。
你能帮我创建一个有效的模式吗?
答案 0 :(得分:2)
你需要一个只有先行的模式:
\s+(?=delim1|delim2)
\s+
将匹配1个或多个空格(因为您的字符串包含空格)。如果没有空格,请使用\s*
(但是您需要从结果中删除空条目)。请参阅regex demo。如果这些分隔符必须是整个单词,请使用\b
字边界:\s+(?=\b(?:delim1|delim2)\b)
。
在C#中:
addrArr = Regex.Split(inputText, string.Format(@"\s+(?={0})", string.Join("|", delimeters)));
如果分隔符可以包含特殊的正则表达式元字符,则需要在Regex.Escape
列表中运行delimiters
。
A C# demo:
var inputText = "substring1 delim1 substring2 delim2 substr3";
var delimeters = new List<string> { "delim1", "delim2" };
var addrArr = Regex.Split(inputText,
string.Format(@"\s+(?={0})", string.Join("|", delimeters.Select(Regex.Escape))));
Console.WriteLine(string.Join("\n", addrArr));
答案 1 :(得分:2)
我认为你需要使用一个前瞻,而不是一个lookbehind,这是为了工作(虽然没有尝试过)。
另外,你必须小心分离器;必须将它们转义为正则表达式中的模式才能正常工作。
试试这个:
addrArr= Regex.Split(inputText, string.Format("(?={0}|{1})", Regex.Escape(delimeter1), Regex.Escape(delimeter2)), RegexOptions.None);