嗨,我的代码是这样的(python 3.3.2)
fw = codecs.open('outputfile.txt','w')
if((unidata[i]==U'\u0d46' and unidata[i-1]==U'\u0d28') and (unidata[i+1]==U'\u0d24') and (unidata[i+2]==U'\u0d4d')):
print ('code 1')
if(var==1):
x=unidata[0:i-1]+U'\u0d7b'+ ' + '+U'\u0d0e'+unidata[i+1:len(unidata)]
first_word=unidata[0:i-1]+U'\u0d7b'
fw.write(str(first_word.encode('UTF-8')))
文件中的输出是这样的:
(b'\xe0\xb4\xb0\xe0\xb4\xbe\xe0\xb4\xae\xe0\xb5\xbb')
实际输出应为:
രാമൻ
如何解决这个问题?
答案 0 :(得分:0)
unicode deconversion issues and solutions
我正在给出他们能够更好地解释的链接bc以及那里的其他功能定义,直接链接页面上的数字3我认为可以帮助你。
答案 1 :(得分:0)
这有效..
fw=open("myunicodefile.txt","w")
fw.write(firstword.encode('UTF-8'))
但我想你是在讲述文件中的字符串#### 是的,使用“”“”str()“”“转换后,实际上将看起来像unicode “\ xe0 \ XB4 \ XB0 \ xe0 \ XB4 \ XBE \ xe0 \ XB4 \ XAE \ xe0 \ XB5 \ XBB”
这是unicode。但是要在texlayitor的malayalam中看到这个,它必须以uncode模式打开 _ __如果您使用python读取该文件,则必须打开该文件并编码为utf
例如: FR =打开( “mytext.txt”, “R”) 数据= fr.read() unicodedata = data.encode( “UTF-8”) 打印unicodedata
这将打印malayalam