什么是文本文件中的¿

时间:2012-10-08 17:29:23

标签: c# encoding character

我正在开发一个处理大量文本文件的C#程序。这些文件是由系统创建的,因此我无法更改源,但在文件中出现多次,导致我的代码崩溃。

是什么意思,我该如何处理呢?

3 个答案:

答案 0 :(得分:3)

¿表示您有一个从其他编码类型转换的字符,并且在您的编码类型的字符表中无法识别。如果您使用其他编码类型,则可以处理它。

Documentation

答案 1 :(得分:3)

Unicode编码文件的开头是“标题”。这个标题告诉程序读取它是一个Unicode文件。这被称为“字节顺序标记”,并向读者表示它是什么类型的Unicode。 http://msdn.microsoft.com/en-us/library/windows/desktop/dd374101(v=vs.85).aspx

答案 2 :(得分:0)

要详细说明我的评论,首先应该找出创建这些编码后使用的编码,然后在阅读时使用该编码。查看:

BinaryReader(Stream, Encoding)

http://msdn.microsoft.com/en-us/library/system.io.binaryreader.aspx