asp.net字符编码问题utf8

时间:2011-01-14 14:24:00

标签: c# asp.net utf-8 character-encoding

我在sql server数据库中存储了一些html编码的数据,我编写了一个脚本来输出csv格式的数据减去html标签,当html解码其余时,我遇到了一个奇怪的问题数据。例如,数据包含引号字符(html编码为’),但当我尝试对其进行html解码时,数据会以一系列奇怪的字符形式出现(â€)。有谁知道如何解决这个问题?如果有帮助,页面的输出编码是UTF-8。

非常感谢任何建议!

干杯

2 个答案:

答案 0 :(得分:3)

这三个奇怪的字符是how UTF-8 encodes the HTML entity ’。 (它们实际上是八位字节0xE2 0x80 0x99,并且这些字节在计算机的默认字符集windows-1252中呈现为“)”。所以我认为你的编码没有问题

显然,已知问题是Excel 2000在UTF-8编码中存在.csv文件问题。奇怪的是,解决方案是switch the filename extension to .txt,此时Excel 2000显然会正确导入文件。

答案 1 :(得分:0)

如果从CSV文件中读取数据,请在记事本中打开csv文件,在文件菜单中按“另存为”,将文件另存为“编码-UTF8”。