孟加拉语文本未显示在Unicode CSV文件中

时间:2012-06-20 09:52:03

标签: mysql excel unicode internationalization

我有孟加拉语的Excel文件。要正确显示孟加拉语文本,我需要在PC上安装孟加拉字体。

我使用Office 2010将Excel文件转换为CSV。但它只显示'?'标记而不是孟加拉语字符。然后我使用Google Docs进行转换,遇到同样的问题,但是字符不可读而不是'?'。我将该文件中的摘录粘贴到HTML文件中,并尝试在浏览器中查看它。

如何从孟加拉语的.xlsx文件中获取CSV文件,以便将其导入MySQL数据库?

修改this SO问题中接受的答案让我转到Google文档。

2 个答案:

答案 0 :(得分:3)

根据问题Excel to CSV with UTF8 encoding的答案,Google文档应该正确保存CSV,与Excel相反,后者会销毁所使用的“ANSI”编码中无法表示的所有字符。但也许他们改变了这个,或者出了什么问题,或者对情况的分析是不正确的。

对于在MS Office程序中处理的正确编码的Bangla(孟加拉语),不需要任何“Bangla字体”,因为Arial Unicode MS字体(Office附带)包含Bangla字符。实际上,某些非标准编码中的数据依赖于特殊编码的字体吗?在这种情况下,它应首先转换为Unicode,但可能使用一致使用该特定字体的程序以某种方式进行管理。

在Excel中,使用“另存为”时,可以选择“Unicode文本(* .txt)”。它以UTF-16编码将数据保存为TSV(制表符分隔值)。然后,您可能需要将其转换为使用逗号作为分隔符而不是制表符,和/或从UTF-16转换为UTF-8。但这仅在原始数据被正确编码时才有效。

答案 1 :(得分:0)

当我需要带有Bangla Unicode字符的CSV文件并且以下方法对我有效时,我也遇到了同样的问题。

  1. 将您的Excel文件(带有Bangla Unicode字符)上传到Google云端硬盘
  2. 现在使用Google表格打开上传的文件
  3. 从Google表格->文件->以逗号分隔的值下载(CSV,当前表格)
  4. 下载的CSV是所需的CSV,带有Bangla Unicode字符。

注意:尽管我用excel打开的文件显示乱码,但在Web应用程序中对我有用,并显示正确的字符。