Python中的希伯来语unicode

时间:2012-10-15 14:32:35

标签: python python-2.7 unicode hebrew

我正在尝试制作英语 - 希伯来语词典 我有一个Tab格式的字典(<word>TAB<translation>)。最后 - 我希望它是以mobi格式。 我发现Python脚本从tab转换为opf(和htmls)。从那里很容易转换为mobi。 Python脚本名为tab2opf.py

当我将原始文件与我的标签(.txt)文件一起使用时 - 一切正常
我正在使用带有内置utf选项的脚本:tab2opf.py -utf tab.txt

问题是我想要我的Kindle字典。 Kindle向后显示希伯来语翻译。所以我决定编辑tab2opf文件,这样他就可以反转翻译了 - 在kindle中它会正确显示。

我写了以下代码:

def RevIt(s):
heb = []
g = ""
for i in range(len(s)):
    c = s[i]
    heb.append(c)
for i in range(len(heb)):
g += heb.pop()
return g

并在第245行dd = RevIt(dd)之后添加的tab2opf.py中 现在我收到了混乱:
"-բ לימלՠ£ילחתכՠ©משמהՠתՠאՠמיסՠ,)¨וביחՠמיסՠ:תכבը נסרפמאՠ,& .צעՠשՠ
对于比较,这是原始txt文件中的同一行的样子:
 שם עצם. &, אמפרסנד (בכתב: סימן חיבור), סימן או תו המשמש כתחליף למילה "ו-"

我做错了什么?

1 个答案:

答案 0 :(得分:4)

您正在使用字节而不是Unicode字符。试试这个:

g = u""
s = s.decode('UTF-8')