用Ruby中的Iconv音译

时间:2010-12-10 15:24:23

标签: ruby iconv transliteration

当我尝试用

音译一个西里尔字母utf-8字符串时
Iconv.iconv('ascii//ignore//translit', 'utf-8', string).to_s

(见questions/1726404/transliteration-in-ruby

除了那些必须音译的符号外,我得到了所有的东西。

例如:'r-строка'→'r-'和'Gévry'→'Gvry'。

怎么了?

Ruby 1.8.7 / Rails 2.3.5 / WSeven

3 个答案:

答案 0 :(得分:2)

似乎the solution对我来说太棘手了。使用stringex gem解决问题。

答案 1 :(得分:2)

require 'iconv'
p Iconv.iconv('ascii//translit//ignore', 'utf-8',  'Gévry') #=> ["Gevry"]
# not         'ascii//ignore//translit'

对于西里尔文,translit宝石可能有用。

答案 2 :(得分:1)

另一种方法是使用String的tr和gsub方法创建自定义translit而不使用iconv。

# encoding: UTF-8

def russian_translit(text)
    translited = text.tr('абвгдеёзийклмнопрстуфхэыь', 'abvgdeezijklmnoprstufhey\'')
    translited = translited.tr('АБВГДЕЁЗИЙКЛМНОПРСТУФХЭ', 'ABVGDEEZIJKLMNOPRSTUFHEY\'')

    translited = translited.gsub(/[жцчшщъюяЖЦЧШЩЪЮЯ]/,
        'ж' => 'zh', 'ц' => 'ts', 'ч' => 'ch', 'ш' => 'sh', 'щ' => 'sch', 'ъ' => '', 'ю' => 'ju', 'я' => 'ja',
        'Ж' => 'ZH', 'Ц' => 'TS', 'Ч' => 'CH', 'Ш' => 'SH', 'Щ' => 'SCH', 'Ъ' => '', 'Ю' => 'JU', 'Я' => 'JA')
    return translited
end

p russian_translit("В чащах юга жил бы цитрус? Да, но фальшивый экземпляр!")
#=> "V chaschah juga zhil by tsitrus? Da, no fal'shivyj ekzempljar!"