我在sql server数据库中存储了一些html编码的数据,我编写了一个脚本来输出csv格式的数据减去html标签,当html解码其余时,我遇到了一个奇怪的问题数据。例如,数据包含引号字符(html编码为’
),但当我尝试对其进行html解码时,数据会以一系列奇怪的字符形式出现(â€)。有谁知道如何解决这个问题?如果有帮助,页面的输出编码是UTF-8。
非常感谢任何建议!
干杯
添
答案 0 :(得分:3)
这三个奇怪的字符是how UTF-8 encodes the HTML entity ’
。 (它们实际上是八位字节0xE2 0x80 0x99
,并且这些字节在计算机的默认字符集windows-1252
中呈现为“)”。所以我认为你的编码没有问题
显然,已知问题是Excel 2000在UTF-8编码中存在.csv文件问题。奇怪的是,解决方案是switch the filename extension to .txt,此时Excel 2000显然会正确导入文件。
答案 1 :(得分:0)
如果从CSV文件中读取数据,请在记事本中打开csv文件,在文件菜单中按“另存为”,将文件另存为“编码-UTF8”。