使用Perl的Spreadsheet :: ParseExcel将Excel文件中的亚洲(日文/中文)字符提取为TSV格式

时间:2012-09-26 17:37:42

标签: perl excel parsing encoding non-ascii-characters

友 我正在准备一个来自excel文件的TSV文件,其中包含中文(特殊)字符如下 - Seonjeongneung ... Jeonghyeon(贞显王后,1462-1530)......

我尝试过使用perl CPAN的Spreadsheet :: ParseExcel和Spreadsheet :: ParseExcel :: FmtJapan。但没有成功。这些字符出现了?在VIM中打开时,在TSV文件中。

我也试过“binmode STDOUT,':utf8';”和“binmode STDOUT,':encoding(cp932)';”

请帮帮我,找到一种从Excel表格中提取信息并进入TSV格式的方法。

PS:Excel允许直接保存为TSV,但输出也被搞砸了

1 个答案:

答案 0 :(得分:0)

我只是通过选择“另存为.csv”选项并选择UTF-8作为格式,完全从OpenOffice Calc导出示例文本。如果Excel不能这样做,我会感到非常惊讶。您是否考虑过VIM /您的控制台不正确支持中文字符或者设置为使用不包含中文字符的字体的可能性?要检查此类错误,请在Web浏览器中打开.csv或.tsv文件。 Web浏览器将执行任何操作以正确显示文件,包括根据需要更改字体。

如果您愿意,请将您需要导出的文件发送给我,我会检查是否有任何奇怪的内容。可能是中文本地编码之一(gb或big5)而不是Unicode。