我正在尝试制作英语 - 希伯来语词典
我有一个Tab格式的字典(<word>TAB<translation>
)。最后 - 我希望它是以mobi格式。
我发现Python脚本从tab转换为opf(和htmls)。从那里很容易转换为mobi。 Python脚本名为tab2opf.py。
当我将原始文件与我的标签(.txt)文件一起使用时 - 一切正常。
我正在使用带有内置utf选项的脚本:tab2opf.py -utf tab.txt
问题是我想要我的Kindle字典。 Kindle向后显示希伯来语翻译。所以我决定编辑tab2opf文件,这样他就可以反转翻译了 - 在kindle中它会正确显示。
我写了以下代码:
def RevIt(s):
heb = []
g = ""
for i in range(len(s)):
c = s[i]
heb.append(c)
for i in range(len(heb)):
g += heb.pop()
return g
并在第245行dd = RevIt(dd)
之后添加的tab2opf.py中
现在我收到了混乱:
"-բ לימלՠ£ילחתכՠ©משמהՠתՠאՠמיסՠ,)¨וביחՠמיסՠ:תכבը נסרפמאՠ,& .צעՠשՠ
对于比较,这是原始txt文件中的同一行的样子:
שם עצם. &, אמפרסנד (בכתב: סימן חיבור), סימן או תו המשמש כתחליף למילה "ו-"
我做错了什么?
答案 0 :(得分:4)
您正在使用字节而不是Unicode字符。试试这个:
g = u""
s = s.decode('UTF-8')