我有一个小插件可以将unicode字符串转换为非unicode字符串。它看起来像:
public static class StringHelper
{
public static string ToNonUnicode(this string source)
{
if (!string.IsNullOrEmpty(source))
{
source = source.Trim().Replace(".", "");
#region rule
IDictionary<string, string> dict = new Dictionary<string, string>
{
{ @"\-|\,", "" },
{ @"\s{2}", " " },
{ "à|á|ả|ã|ạ|ă|â|ấ|ầ|ẩ|ẫ|ậ|ằ|ẳ|ắ|ẵ|ặ", "a" },
{ "á|à|ả|ã|ạ|â|ă|ấ|ầ|ẩ|ẫ|ậ|ắ|ằ|ẳ|ẵ|ặ", "a" },
{ "À|Á|Ả|Ã|Ạ|Ă|Â|Ầ|Ấ|Ẩ|Ẫ|Ậ|Ằ|Ắ|Ẳ|Ẵ|Ặ", "A" },
{ "Á|À|Ả|Ã|Ạ|Â|Ă|Ấ|Ầ|Ẩ|Ẫ|Ậ|Ắ|Ằ|Ẳ|Ẵ|Ặ", "A" },
{ "ò|ó|ỏ|õ|ọ|ô|ơ|ồ|ố|ổ|ỗ|ộ|ờ|ớ|ở|ỡ|ợ", "o" },
{ "ó|ò|ỏ|õ|ọ|ô|ơ|ố|ồ|ổ|ỗ|ộ|ớ|ờ|ở|ỡ|ợ", "o" },
{ "Ò|Ó|Ỏ|Õ|Ọ|Ô|Ơ|Ồ|Ố|Ổ|Ỗ|Ộ|Ờ|Ớ|Ở|Ỡ|Ợ", "O" },
{ "Ó|Ò|Ỏ|Õ|Ọ|Ô|Ơ|Ố|Ồ|Ổ|Ỗ|Ộ|Ớ|Ờ|Ở|Ỡ|Ợ", "O" },
{ "è|é|ẻ|ẽ|ẹ|ê|ề|ế|ể|ễ|ệ", "e" },
{ "é|è|ẻ|ẽ|ẹ|ê|ế|ề|ể|ễ|ệ", "e" },
{ "È|É|Ẻ|Ẽ|Ẹ|Ê|Ề|Ế|Ể|Ễ|Ệ", "E" },
{ "É|È|Ẻ|Ẽ|Ẹ|Ê|Ế|Ề|Ể|Ễ|Ệ", "E" },
{ "ù|ú|ủ|ũ|ụ|ư|ừ|ứ|ử|ữ|ự", "u" },
{ "ú|ù|ủ|ũ|ụ|ư|ứ|ừ|ử|ữ|ự", "u" },
{ "Ù|Ú|Ủ|Ũ|Ụ|Ư|Ừ|Ứ|Ử|Ữ|Ự", "U" },
{ "Ú|Ù|Ủ|Ũ|Ụ|Ư|Ứ|Ừ|Ử|Ữ|Ự", "U" },
{ "ì|í|ỉ|ĩ|ị|í|ì|ỉ|ĩ|ị", "i" },
{ "Ì|Í|Ỉ|Ĩ|Ị|Í|Ì|Ỉ|Ĩ|Ị", "I" },
{ "ỳ|ý|ỷ|ỹ|ỵ|ý|ỳ|ỷ|ỹ|ỵ", "y" },
{ "Ỳ|Ý|Ỷ|Ỹ|Ỵ|Ý|Ỳ|Ỷ|Ỹ|Ỵ", "Y" },
{ "đ", "d" }, { "Đ", "D" }
};
#endregion
foreach (var d in dict)
{
var matches = Regex.Matches(source, d.Key);
foreach (Match match in matches)
{
source = Regex.Replace(source, match.Value, d.Value);
}
}
}
return source;
}
}
测试:
string str = "Làm người yêu em nhé baby...";
string res = str.ToNonUnicode(); // "Lam nguoi yeu em nhe baby"
要实现这一点,我必须使用循环两次,一次用于匹配,一次用于替换。我正在寻找另一种方法来更快地编写代码。使用LinQ是我想的一种方式,但我不知道我要去哪里。
你可以给我一些提示吗?谢谢!答案 0 :(得分:2)
您不需要Matches
循环,只需直接使用Regex.Replace
foreach (var d in dict)
{
source = Regex.Replace(source, d.Key, d.Value);
}