在我们的RoR项目中,我们使用postgres unaccent函数来检索我们的模型名称属性之一的unaccent版本。 name属性可以包含来自各种语言的任何重音字符。然后我们将其保存为unaccent_name属性。我不喜欢这个解决方案,因为我们需要确保安装和访问postgres扩展UNACCENT(在测试,移动/清理数据库等时)。
在RoR中有ActiveSupport :: Inflector.transliterate方法,它应该做一些非常相似的事情。
我发现它主要以同样的方式翻译重音字符,但也存在一些差异:
同样的结果:
SELECT unaccent('ľščťžý') AS unaccent_name;
=> "lsctzy"
ActiveSupport::Inflector.transliterate('ľščťžý')
=> "lsctzy"
不同的结果:
SELECT unaccent('ß') AS unaccent_name;
=> "S"
ActiveSupport::Inflector.transliterate('ß')
=> "ss"
我知道这两种方法都可以接受带有自定义字母替换的词典,但我只对它们的一般/默认用法感兴趣。
音译方法的主要目的是与postgres unaccent函数相同吗?我们可以用它作为替代品吗?
答案 0 :(得分:1)
帖子很旧,但是我正在解决类似于OP的问题。我们希望能够搜索名称并音译以得到更好的结果。但是,在我们的Postgres和rails版本中,字符会将其音译为'ss'。
只是想分享我的发现,以免对偶然发现这篇文章的其他人有用。
在Rails 5.2中:
irb(main):001:0> ActiveSupport::Inflector.transliterate('ß')
=> "ss"
在postgres 9.6中,我得到:
db-test=# SELECT unaccent('ß') AS unaccent_name;
unaccent_name
---------------
ss
(1 row)