所以我看到了Jon的双向飞碟video并且有一个代码示例:
é
应该出现问题 - 在倒车之后但是我猜它在.net2(恕我直言)上失败了,无论如何它确实对我有用,我确实看到正确反转的字符串。
char[] a="Les Misérables".ToCharArray();
Array.Reverse(a);
string n= new string(a);
Console.WriteLine (n); //selbarésiM seL
但我更进一步:
在希伯来语中有“Alef”字符:א
我可以添加标点符号:אֳ
(我相信它包含2个字符 - 但显示为一个。)
但现在看看会发生什么:
char[] a="Les Misאֳrables".ToCharArray();
Array.Reverse(a);
string n= new string(a);
Console.WriteLine (n); //selbarֳאsiM seL
有分歧...
我能理解为什么会这样:
Console.WriteLine ("אֳ".Length); //2
所以我想知道在C#中是否存在针对此类问题的解决方法(或者我应该构建自己的机制......)
答案 0 :(得分:37)
问题是Array.Reverse
不知道char
值的某些序列可能组合形成单个字符或“字形”,因此不应该反转。您必须使用能够理解Unicode组合字符序列的内容,例如TextElementEnumerator:
// using System.Globalization;
TextElementEnumerator enumerator =
StringInfo.GetTextElementEnumerator("Les Misאֳrables");
List<string> elements = new List<string>();
while (enumerator.MoveNext())
elements.Add(enumerator.GetTextElement());
elements.Reverse();
string reversed = string.Concat(elements); // selbarאֳsiM seL
答案 1 :(得分:10)
如果你做了扩展
public static IEnumerable<string> ToTextElements(this string source)
{
var e = StringInfo.GetTextElementEnumerator(source)
while (e.MoveNext())
{
yield return e.GetTextElement();
}
}
你可以做到,
const string a = "AnyStringYouLike";
var aReversed = string.Concat(a.ToTextElements().Reverse());