ruby 1.9 + sinatra不兼容的字符编码:ASCII-8BIT和UTF-8

时间:2010-07-11 15:14:46

标签: ruby encoding sinatra erb utf-8

我正在尝试将sinatra应用程序迁移到ruby 1.9

我正在使用sinatra 1.0,rack 1.2.0和erb templates

当我启动sinatra时,它可以工作,但是当我从浏览器请求网页时,我收到此错误:

Encoding::CompatibilityError at /
incompatible character encodings: ASCII-8BIT and UTF-8

所有.rb文件都有此标题:

#!/usr/bin/env ruby
# encoding: utf-8

我认为问题出现在erb文件中,即使它表明它是UTF-8编码的

[user@localhost views]$ file home.erb
home.erb: UTF-8 Unicode text

以前有人遇到过这个问题吗? sinatra与ruby 1.9不完全兼容吗?

2 个答案:

答案 0 :(得分:15)

我不熟悉您的具体情况,但是当尝试将源代码中的字符串(通常以UTF-8编码)与来自的字符串连接起来时,Ruby 1.9中出现了这种错误。在系统外部,例如,来自HTML表单的输入或来自数据库的数据。

ASCII-8BIT基本上是二进制的同义词。它表明输入字符串未使用已使用的实际编码标记(例如,UTF-8或ISO-8859-1)。

我的理解是在Ruby 1.8中看不到异常消息,因为它将字符串视为二进制并静默连接不同编码的字符串。出于微妙的原因,这通常不是问题。

昨天我遇到了类似的错误,发现了这个非常好的概述。

让错误消息消失的一个选项是对来自外部源的字符串使用force_encoding('UTF-8')(或其他一些编码)。这不是轻易做到的,你会想要了解其含义。

答案 1 :(得分:0)

我有同样的问题。问题是一个utf8编码的文件应该是us-ascii。

我使用file命令(在OSX上)检查:

$ file --mime-encoding somefile
somefile: utf-8

从文件中删除奇怪的字符后:

$ file --mime-encoding somefile
somefile: us-ascii

这解决了我的问题。