我正在使用d3.js加载.csv文件,其中包含以下格式的数据:
“region”,“party”,“Year = 2014”“0114UpplandsVäsby”,“Moderaterna”,28.4 “0114UpplandsVäsby”,“Centerpartiet”,3.7“0114 Upplands Väsby“,”Folkpartiet“,6.1”0114UpplandsVäsby“,”Kristdemokraterna“,4.5 “0114UpplandsVäsby”,“Miljöpartiet”,6.8“0114 Upplands Väsby“,”Socialdemokraterna“,30.3”0114 Upplands Väsby“,”Vänsterpartiet“,5.8”0114 Upplands ·韦斯比”, “Sverigedemokraterna”,10.9
正如您所看到的,数据中有一些字符如“ä”,“ö”。当我读取数据并在页面上显示它们时(使用谷歌浏览器),我看到以下内容:
0114UpplandsV sby * Moderaterna *
0114UpplandsV sby * Centerpartiet *
0114UpplandsV sby * Folkpartiet *
0114UpplandsV sby * Kristdemokraterna *
0114UpplandsV sby *Milj partiet*
0114UpplandsV sby * Socialdemokraterna *
0114UpplandsV sby *V nsterpartiet*
0114UpplandsV sby * Sverigedemokraterna *
0114UpplandsV sby * vrigapartier*
0114UpplandsV sby * ogiltiga valsedlar *
0114UpplandsV sby *ejr stande*
您可以看到特殊字符被问号替换。如何显示数据集中的实际字符?
答案 0 :(得分:0)
您应该使用与语言无关的字符集。业界一致认为将Unicode用于多语言(在广义上,使用超过7位ACSII数据的所有内容)应用程序。这是来自维基百科页面的引用。
Unicode是一种计算行业标准,用于在世界上大多数书写系统中表达的文本的一致编码,表示和处理。
西方语言最常见且规模最大的Unicode编码是UTF-8。因此,您唯一需要做的就是使应用程序编码保持一致。这意味着您的HTTP资源应该以UTF-8编码,其元数据表示为UTF-8。最像你有不正确的元数据,所以请确保你有:
<meta http-equiv="content-type" content="text/html; charset=utf-8" />
Content-Type: text/html; charset=utf-8
Content-Type: text/csv; charset=utf-8