我在C#中有一个关于字符串和字符的问题。我发现C#中的字符串是一个Unicode字符串,而char需要2个字节。所以每个char都采用UTF-16编码。这很好,但我也在维基百科上读到有些字符在UTF-16中占用4个字节。
我正在做一个程序,可以让你为字母数字显示绘制字符。在程序中还有一个测试器,你可以在其中编写一些字符串,并为它绘制它以查看它的外观。
所以我应该如何使用字符串,用户写入一个占用4个字节的字符,即2个字符。因为我需要通过字符串char来char,所以在列表中找到这个char,并将其绘制到面板中。
答案 0 :(得分:4)
你可以这样做:
for( int i = 0; i < str.Length; ++i ) {
int codePoint = Char.ConvertToUTF32( str, i );
if( codePoint > 0xffff ) {
i++;
}
}
然后codePoint
将任何可能的代码点表示为32位整数。
答案 1 :(得分:0)
完全使用String
个对象;根本不要使用Char
。使用IndexOf
的示例:
var needle = "ℬ"; // U+1D49D (I think)
var hayStack = "a code point outside basic multi lingual plane: ℬ";
var index = heyStack.IndexOf(needle);
String
类上的大多数方法都有接受Char
或String
的重载。 Char
上的大多数方法都有使用String
的覆盖。只是不要使用Char
。