改变了从俄语到英语的解释

时间:2017-02-08 06:23:11

标签: python replace str-replace transliteration

我需要创建一个程序,以不同的方式将俄语命名为英语。

例如,俄语姓氏:

  

Муравьёв

英文可能的解释:

  

穆拉维约夫; Myravyev;穆拉维耶夫; Muraviov; Murav'ev;穆拉维约夫; Murav'yev; Murav'ov; Muravjov; Muravjev; Mouravieff; Muravieff; Mouravief;   Muravief; Muraviof; Muravioff;

我找到了现有的音译Python包transliterate_1.9,它具有从Cyrilic到英语的标准化音译形式。 问题是我还需要另一种可能的英语解释。我想过在Python中替换方法,但没有想出如何制作正确的代码。

此时我有这个:

def translit(string):

capital_letters = {
    u'А': u'A',
    u'Б': u'B',
    u'В': u'V',
    u'Г': u'G',
    u'Д': u'D',
    u'Е': u'E',
    u'Ё': u'E',
    u'Ж': u'Zh',
    u'З': u'Z',
    u'И': u'I',
    u'Й': u'Y',
    u'К': u'K',
    u'Л': u'L',
    u'М': u'M',
    u'Н': u'N',
    u'О': u'O',
    u'П': u'P',
    u'Р': u'R',
    u'С': u'S',
    u'Т': u'T',
    u'У': u'U',
    u'Ф': u'F',
    u'Х': u'H',
    u'Ц': u'Ts',
    u'Ч': u'Ch',
    u'Ш': u'Sh',
    u'Щ': u'Sch',
    u'Ъ': u'',
    u'Ы': u'Y',
    u'Ь': u'',
    u'Э': u'E',
    u'Ю': u'Yu',
    u'Я': u'Ya'
}

lower_case_letters = {
    u'а': u'a',
    u'б': u'b',
    u'в': u'v',
    u'г': u'g',
    u'д': u'd',
    u'е': u'e',
    u'ё': u'e',
    u'ж': u'zh',
    u'з': u'z',
    u'и': u'i',
    u'й': u'y',
    u'к': u'k',
    u'л': u'l',
    u'м': u'm',
    u'н': u'n',
    u'о': u'o',
    u'п': u'p',
    u'р': u'r',
    u'с': u's',
    u'т': u't',
    u'у': u'u',
    u'ф': u'f',
    u'х': u'h',
    u'ц': u'ts',
    u'ч': u'ch',
    u'ш': u'sh',
    u'щ': u'sch',
    u'ъ': u'',
    u'ы': u'y',
    u'ь': u'',
    u'э': u'e',
    u'ю': u'yu',
    u'я': u'ya'
}

translit_string = ""

for index, char in enumerate(string):
    if char in lower_case_letters.keys():
        char = lower_case_letters[char]
    elif char in capital_letters.keys():
        char = capital_letters[char]
        if len(string) > index+1:
            if string[index+1] not in lower_case_letters.keys():
                char = char.upper()
        else:
            char = char.upper()
    translit_string += char

return translit_string

我是一个新的编码器和编程大约2-3个月,并学习了一点点Python。我可以在字符串中使用or来获得其他可能的答案吗?或者也许如何在这里使用replacing method来获得其他可能的答案。

1 个答案:

答案 0 :(得分:0)

您可以分叉CyrTranslit Python包并按照instructions on how to add support for a new language包含其他俄语音译词典。