postgres unaccent function vs RoR transliterate

时间:2016-09-16 18:30:49

标签: ruby-on-rails postgresql unaccent

在我们的RoR项目中,我们使用postgres unaccent函数来检索我们的模型名称属性之一的unaccent版本。 name属性可以包含来自各种语言的任何重音字符。然后我们将其保存为unaccent_name属性。我不喜欢这个解决方案,因为我们需要确保安装和访问postgres扩展UNACCENT(在测试,移动/清理数据库等时)。

在RoR中有ActiveSupport :: Inflector.transliterate方法,它应该做一些非常相似的事情。

我发现它主要以同样的方式翻译重音字符,但也存在一些差异:

同样的结果:

SELECT unaccent('ľščťžý') AS unaccent_name;
=> "lsctzy"
ActiveSupport::Inflector.transliterate('ľščťžý')
=> "lsctzy"

不同的结果:

SELECT unaccent('ß') AS unaccent_name;
=> "S"
ActiveSupport::Inflector.transliterate('ß')
=> "ss"

我知道这两种方法都可以接受带有自定义字母替换的词典,但我只对它们的一般/默认用法感兴趣。

音译方法的主要目的是与postgres unaccent函数相同吗?我们可以用它作为替代品吗?

1 个答案:

答案 0 :(得分:1)

帖子很旧,但是我正在解决类似于OP的问题。我们希望能够搜索名称并音译以得到更好的结果。但是,在我们的Postgres和rails版本中,字符会将其音译为'ss'。

只是想分享我的发现,以免对偶然发现这篇文章的其他人有用。

在Rails 5.2中:

irb(main):001:0> ActiveSupport::Inflector.transliterate('ß')
=> "ss"

在postgres 9.6中,我得到:

db-test=# SELECT unaccent('ß') AS unaccent_name;
 unaccent_name 
---------------
 ss
(1 row)