使用不区分大小写的正则表达式替换时需要注意哪些事项?

时间:2009-12-03 14:05:42

标签: c# regex replace case-insensitive

我编写了以下代码来在C#中执行不区分大小写的替换:

Regex.Replace(textBoxText, 
    Regex.Escape(findText), 
    replaceText, 
    RegexOptions.IgnoreCase);

只是想检查一下,这是否是正确的方法,还是有更好的方法,我是否忽视了一些我应该更清楚的事情。

注意:请不要向我提供一些手工编写的代码,我使用了codeproject中的快速替换功能,并且该代码在客户端崩溃,我无法知道用户正在使用什么输入。所以,我更喜欢一些简单但正确可靠的方法。

1 个答案:

答案 0 :(得分:7)

您的代码似乎没问题,但请记住,当您执行不区分大小写的匹配时,可以使用当前的区域设置或区域性。最好添加您想要的文化,或让用户选择它。 CultureInvariant通常是在任何语言环境中采取相同行为的一般选择:

Regex.Replace(textBoxText, 
    Regex.Escape(findText), 
    replaceText, 
    RegexOptions.IgnoreCase | RegexOptions.CultureInvariant);

要使用其他语言环境,您需要多做一些hocus pocus:

// remember current
CultureInfo originalCulture = Thread.CurrentThread.CurrentCulture;

// set user-selected culture here (in place of "en-US")
Thread.CurrentThread.CurrentCulture = CultureInfo.CreateSpecificCulture("en-US");

// do the regex
Regex.Replace(textBoxText, 
    Regex.Escape(findText), 
    replaceText, 
    RegexOptions.IgnoreCase);

// reset the original culture
Thread.CurrentThread.CurrentCulture = originalCulture;

请注意,您可以打开或关闭不区分大小写。这不是一个切换,这意味着:

// these three statements are equivalent and yield the same results:
Regex.Replace("tExT", "[a-z]", "", RegexOptions.IgnoreCase);
Regex.Replace("tExT", "(?i)[a-z]", "", RegexOptions.IgnoreCase);
Regex.Replace("tExT", "(?i)[a-z]", "");

// once IgnoreCase is used, this switches it off for the whole expression...
Regex.Replace("tExT", "(?-i)[a-z]", "", RegexOptions.IgnoreCase);

//...and this can switch it off for only a part of the expression:
Regex.Replace("tExT", "(?:(?-i)[a-z])", "", RegexOptions.IgnoreCase);

最后一个很有意思:在非捕获分组括号后的(?:)之间,案例切换(?-i)不再有效。您可以在表达式中随意使用它。在没有分组的情况下使用它会使它们有效,直到下一个区分大小写的开关,或者到最后。

更新: 我做出了错误的假设,即您无法进行区分大小写切换。考虑到这一点,编辑上面的文本。