使用Rails将文本编码为UTF-16LE for Windows

时间:2012-12-19 19:19:46

标签: ruby-on-rails character-encoding utf-16le

我有一个PLC应用程序,需要UTF-16LE的Unicode格式来支持重音字符。我构建文本并将其转换为:

str = Iconv.conv("utf-16le", "utf-8", str)

然后我用以下内容输出文件:

send_data str, :filename => "sp_table.txt", :type => 'text/plain; charset=utf-16le; header=present;', :disposition => 'attachment'

PLC应用程序无法显示字符。如果我用file -I读取文件类型属性,我会得到以下结果:

sp_table.txt: application/octet-stream; charset=binary

如果我在Windows的记事本中打开文件,它会正确显示。如果我通过记事本重新保存文件,选择Unicode作为编码,file -I将返回:

sp_table.txt: text/plain; charset=utf-16le

此外,通过记事本保存后,我能够正确显示PLC应用程序中的所有字符。

发送文件时,我应该指定不同的字符集吗?

1 个答案:

答案 0 :(得分:1)

记事本添加了BOM,而UTF-16LE没有。我对ruby语法有点不确定,但是像这样:

str = Iconv.conv("utf-16le", "utf-8", "\ufeff" + str)

或者

str = "\xFF\xFE" + Iconv.conv("utf-16le", "utf-8", str)

或者

str = "\377\376" + Iconv.conv("utf-16le", "utf-8", str)

基本上,我们的想法是在发送之前在开头添加字节0xFF 0xFE(Little Endian UTF-16的BOM)。