我如何正确编码ł等?

时间:2014-03-24 20:02:45

标签: ruby-on-rails encoding ruby-on-rails-4 character-encoding

我将遗留数据库导入SQLite,其中包含许多包含URL编码字符串的字段。遗留数据库是使用latin1编码设置的,它有很多像这样编码的波兰字符

  

“B%26%23322%3Bad + zapisu +%2D + powinno +由%26%23263%3B + BRAK”

在CGI :: unescape之后给出

  

“bł ad zapisu - powinno być brak”

我尝试在字符串上强制执行ISO-8859-1和cp1250以将它们编码为UTF-8,但没有成功:我仍然以转义波兰字符结束。我已经研究了两天了,但仍然无法找到解决方案。你能帮帮我吗?

1 个答案:

答案 0 :(得分:4)

它与UTF-8编码无关,因为它是HTML编码。你需要这样做

CGI::unescapeHTML(CGI::unescape("b%26%23322%3Bad+zapisu+%2D+powinno+by%26%23263%3B+brak"))