如何处理奇怪的unicode字符

时间:2014-10-30 00:30:46

标签: unicode ascii

NSTR 2009-A - Underlying获得了130万美元(仍为9130万美元)。 C / E升至67.1%

下面是Notepad ++中上面文字的图像,其中UTF-8中的编码已打开。 'x96'是破折号,'xA0'是空格。 SQL Server提供无效字符错误。我如何摆脱这些@#$#?这让我很难解决......; -x

enter image description here

我在下面尝试过。它保留了破折号,但将'xA0'改为问号:

byte[] tempBytes;
tempBytes = System.Text.Encoding.GetEncoding("ISO-8859-8").GetBytes(notesXML);
string notesXML = System.Text.Encoding.UTF8.GetString(tempBytes);

提示赞赏,谢谢!

1 个答案:

答案 0 :(得分:2)

原始文字的编码可能是Windows 1252

96 = U+2013 : EN DASH
A0 = U+00A0 : NO-BREAK SPACE

因此,使用System.Text.Encoding.GetEncoding("Windows-1252"),您应该能够在不破坏原始文本的情况下阅读原始文本,然后可以将其转换为数据库正在使用的任何编码(例如:utf-8)。< / p>