我正在处理大量具有人员数据的CSV文件,偶尔名称会使用非字母数字字符,例如á,这些字符都会成为数据表中的 符号。我该如何防止这个问题?我只想将所有名称保留在文件中而不做任何更改。
谢谢,
→
答案 0 :(得分:1)
最常见的原因是它实际上是用ISO-8859-1编码并解释为UTF-8。由于不太常见的原因,同样的原则适用,也就是说,某些东西采用与其声称不同的编码。
答案 1 :(得分:0)
更改数据库中的字符编码或从数据库中读取时对其进行解码。
答案 2 :(得分:0)
在处理过程中,您需要读者或其他东西。我建议您使用System.Encoding.UnicodeEncoding或UTF32Encoding进行配置。