我有孟加拉语的Excel文件。要正确显示孟加拉语文本,我需要在PC上安装孟加拉字体。
我使用Office 2010将Excel文件转换为CSV。但它只显示'?'标记而不是孟加拉语字符。然后我使用Google Docs进行转换,遇到同样的问题,但是字符不可读而不是'?'。我将该文件中的摘录粘贴到HTML文件中,并尝试在浏览器中查看它。
如何从孟加拉语的.xlsx文件中获取CSV文件,以便将其导入MySQL数据库?
修改:this SO问题中接受的答案让我转到Google文档。
答案 0 :(得分:3)
根据问题Excel to CSV with UTF8 encoding的答案,Google文档应该正确保存CSV,与Excel相反,后者会销毁所使用的“ANSI”编码中无法表示的所有字符。但也许他们改变了这个,或者出了什么问题,或者对情况的分析是不正确的。
对于在MS Office程序中处理的正确编码的Bangla(孟加拉语),不需要任何“Bangla字体”,因为Arial Unicode MS字体(Office附带)包含Bangla字符。实际上,某些非标准编码中的数据依赖于特殊编码的字体吗?在这种情况下,它应首先转换为Unicode,但可能使用一致使用该特定字体的程序以某种方式进行管理。
在Excel中,使用“另存为”时,可以选择“Unicode文本(* .txt)”。它以UTF-16编码将数据保存为TSV(制表符分隔值)。然后,您可能需要将其转换为使用逗号作为分隔符而不是制表符,和/或从UTF-16转换为UTF-8。但这仅在原始数据被正确编码时才有效。
答案 1 :(得分:0)
当我需要带有Bangla Unicode字符的CSV文件并且以下方法对我有效时,我也遇到了同样的问题。
注意:尽管我用excel打开的文件显示乱码,但在Web应用程序中对我有用,并显示正确的字符。