Rails mysql2迁移破坏utf8字符串

时间:2012-11-18 16:21:37

标签: ruby-on-rails utf-8 mysql2

我将旧的mysql数据库迁移到新的数据库,因此我编写了一个连接旧数据库的脚本,读取它并在新数据库中创建新实体。这是:

old_db = Mysql2::Client.new(host: options[:db_host],
                            username: options[:db_user],
                            password: options[:db_password],
                            database: options[:db_name],
                            encoding: 'utf8')
old_categories = old_db.query('select id, title from catalog__category order by lvl asc')
old_categories.each do |old_c|
  c = Catalog::Category.new
  c.name = old_c["title"]
  c.save!
end

然而,在迁移后,类别名称的形状非常糟糕。 两个数据库都以utf8编码。客户端和服务器设置utf8编码

mysql> show variables like "%character%";
+--------------------------+------------------------------------------------------+
| Variable_name            | Value                                                |
+--------------------------+------------------------------------------------------+
| character_set_client     | utf8                                                 |
| character_set_connection | utf8                                                 |
| character_set_database   | utf8                                                 |
| character_set_filesystem | binary                                               |
| character_set_results    | utf8                                                 |
| character_set_server     | utf8                                                 |
| character_set_system     | utf8                                                 |
| character_sets_dir       | /usr/local/Cellar/mysql/5.5.27/share/mysql/charsets/ |

PHP项目使用旧数据库并正确显示所有字符串, Rails项目使用新数据库并正确显示所有内容,但导入了类别字符串。

有谁知道问题出在哪里以及如何解决?

谢谢。

1 个答案:

答案 0 :(得分:0)

数据库本身编码错误的根本问题(前一段时间它已从latin1更改为utf8)。结果,字符串在转储中被编码了两次。

mysqldump --default-character-set=latin1 --skip-set-charset -u <user> -p > b.sql

此命令有助于生成正确的转储