将UTF-8字节数组解码为字符串后,找到特定字符

时间:2017-08-11 12:17:06

标签: c# string unicode encoding utf-8

我有一个包含UTF-8编码字符的byte[]数组。 (该数组可以包含一些原始字节部分,这些部分可能对应于无效的UTF-8序列。)

当我将数组解码为字符串时,如何确定字符串中的哪个字符从数组中的哪个字节位置开始?

示例
字节数组包含编码字符串"pay attention, here come 10 raw bytes:%$�²& bla bla bla bla"

当我将整个数组转换为字符串,并在该字符串中搜索短语"10 raw bytes:"时,如何判断原始字节数组中哪个索引的短语"10 raw bytes:"开始和结束?< / p>

目前我正使用decoder.GetChars(byteArray, 0, byteArray.Length, charArray, 0);

解码我的数组

0 个答案:

没有答案