我有一个包含希伯来字符的XML,但是在键入(Windows'CAT')它到屏幕时 - 它显示了Gibrish。因此,我安装了Console2并将编码(chcp)更改为862或1255,然后显示良好,但是,当尝试使用Nokogiri或REXML解析它时 - 它会抛出异常 - “格式错误的xml:缺少标记启动”
所以,如果有人知道如何摆脱这种混乱,可以指导我在哪种编码中保存什么,并且因为我在没有合适解决方案的情况下搜索整个网络而得到这项工作。
我使用的是Windows XP 32位。 我的Ruby IDE是Aptana 3,Ruby versio是1.8.7
有人可以帮我吗?
答案 0 :(得分:1)
已知Ruby 1.8.7存在编码问题。这里有一个类似的问题(见"Encoding in Ruby 1.8.7 or 1.9.2"),可以帮助您找到方法。所以安装gem character-encodings
并在ruby文件中需要它。然后使用u'myStrüng'
为您要处理的字符串添加前缀(我在此处使用了德语变音符号)。