在python 3.3.2中转换为malayalama文本

时间:2013-10-24 06:35:12

标签: python

嗨,我的代码是这样的(python 3.3.2)

fw = codecs.open('outputfile.txt','w')
if((unidata[i]==U'\u0d46' and unidata[i-1]==U'\u0d28') and (unidata[i+1]==U'\u0d24') and (unidata[i+2]==U'\u0d4d')):
    print ('code 1')
    if(var==1):
        x=unidata[0:i-1]+U'\u0d7b'+ ' + '+U'\u0d0e'+unidata[i+1:len(unidata)]
    first_word=unidata[0:i-1]+U'\u0d7b'
fw.write(str(first_word.encode('UTF-8')))

文件中的输出是这样的:

(b'\xe0\xb4\xb0\xe0\xb4\xbe\xe0\xb4\xae\xe0\xb5\xbb') 

实际输出应为:

രാമൻ

如何解决这个问题?

2 个答案:

答案 0 :(得分:0)

unicode deconversion issues and solutions

我正在给出他们能够更好地解释的链接bc以及那里的其他功能定义,直接链接页面上的数字3我认为可以帮助你。

答案 1 :(得分:0)

这有效..

fw=open("myunicodefile.txt","w")
fw.write(firstword.encode('UTF-8'))

但我想你是在讲述文件中的字符串#### 是的,使用“”“”str()“”“转换后,实际上将看起来像unicode     “\ xe0 \ XB4 \ XB0 \ xe0 \ XB4 \ XBE \ xe0 \ XB4 \ XAE \ xe0 \ XB5 \ XBB”

这是unicode。但是要在texlayitor的malayalam中看到这个,它必须以uncode模式打开 _ __如果您使用python读取该文件,则必须打开该文件并编码为utf

例如:     FR =打开( “mytext.txt”, “R”)     数据= fr.read()     unicodedata = data.encode( “UTF-8”)     打印unicodedata

这将打印malayalam