显示使用d3.csv

时间:2015-04-30 04:33:25

标签: csv d3.js encoding

我正在使用d3.js加载.csv文件,其中包含以下格式的数据:

  

“region”,“party”,“Year = 2014”“0114UpplandsVäsby”,“Moderaterna”,28.4   “0114UpplandsVäsby”,“Centerpartiet”,3.7“0114 Upplands   Väsby“,”Folkpartiet“,6.1”0114UpplandsVäsby“,”Kristdemokraterna“,4.5   “0114UpplandsVäsby”,“Miljöpartiet”,6.8“0114 Upplands   Väsby“,”Socialdemokraterna“,30.3”0114 Upplands   Väsby“,”Vänsterpartiet“,5.8”0114 Upplands   ·韦斯比”, “Sverigedemokraterna”,10.9

正如您所看到的,数据中有一些字符如“ä”,“ö”。当我读取数据并在页面上显示它们时(使用谷歌浏览器),我看到以下内容:

  

0114UpplandsV sby * Moderaterna *

     

0114UpplandsV sby * Centerpartiet *

     

0114UpplandsV sby * Folkpartiet *

     

0114UpplandsV sby * Kristdemokraterna *

     

0114UpplandsV sby *Milj partiet*

     

0114UpplandsV sby * Socialdemokraterna *

     

0114UpplandsV sby *V nsterpartiet*

     

0114UpplandsV sby * Sverigedemokraterna *

     

0114UpplandsV sby * vrigapartier*

     

0114UpplandsV sby * ogiltiga valsedlar *

     

0114UpplandsV sby *ejr stande*

您可以看到特殊字符被问号替换。如何显示数据集中的实际字符?

1 个答案:

答案 0 :(得分:0)

您应该使用与语言无关的字符集。业界一致认为将Unicode用于多语言(在广义上,使用超过7位ACSII数据的所有内容)应用程序。这是来自维基百科页面的引用。

  

Unicode是一种计算行业标准,用于在世界上大多数书写系统中表达的文本的一致编码,表示和处理。

西方语言最常见且规模最大的Unicode编码是UTF-8。因此,您唯一需要做的就是使应用程序编码保持一致。这意味着您的HTTP资源应该以UTF-8编码,其元数据表示为UTF-8。最像你有不正确的元数据,所以请确保你有:

  • 页面的HTML元标记<meta http-equiv="content-type" content="text/html; charset=utf-8" />
  • 页面的HTTP标头Content-Type: text/html; charset=utf-8
  • csv文件的HTTP标头Content-Type: text/csv; charset=utf-8