Question

嗨，我的代码是这样的（python 3.3.2）

fw = codecs.open('outputfile.txt','w')
if((unidata[i]==U'\u0d46' and unidata[i-1]==U'\u0d28') and (unidata[i+1]==U'\u0d24') and (unidata[i+2]==U'\u0d4d')):
    print ('code 1')
    if(var==1):
        x=unidata[0:i-1]+U'\u0d7b'+ ' + '+U'\u0d0e'+unidata[i+1:len(unidata)]
    first_word=unidata[0:i-1]+U'\u0d7b'
fw.write(str(first_word.encode('UTF-8')))

文件中的输出是这样的：

(b'\xe0\xb4\xb0\xe0\xb4\xbe\xe0\xb4\xae\xe0\xb5\xbb')

实际输出应为：

രാമൻ

如何解决这个问题？

Answer 1

unicode deconversion issues and solutions

我正在给出他们能够更好地解释的链接bc以及那里的其他功能定义，直接链接页面上的数字3我认为可以帮助你。

Answer 2

这有效..

fw=open("myunicodefile.txt","w")
fw.write(firstword.encode('UTF-8'))

但我想你是在讲述文件中的字符串#### 是的，使用“”“”str（）“”“转换后，实际上将看起来像unicode “\ xe0 \ XB4 \ XB0 \ xe0 \ XB4 \ XBE \ xe0 \ XB4 \ XAE \ xe0 \ XB5 \ XBB”

这是unicode。但是要在texlayitor的malayalam中看到这个，它必须以uncode模式打开 _ __如果您使用python读取该文件，则必须打开该文件并编码为utf

例如： FR =打开（ “mytext.txt”， “R”）数据= fr.read（） unicodedata = data.encode（ “UTF-8”）打印unicodedata

这将打印malayalam

在python 3.3.2中转换为malayalama文本

2 个答案: