处理俄语文本文件失败

时间:2013-10-30 12:06:30

标签: python unicode

我有这段代码:

# -*- coding: utf-8 -*-
import codecs
prefix = u"а"

rus_file = "rus_names.txt"
output = "rus_surnames.txt"

with codecs.open(rus_file, 'r', 'utf-8') as infile:
    with codecs.open(output, 'a', 'utf-8') as outfile:
        for line in infile.readlines():
        outfile.write(line+prefix)

它在输出文件中给了我一些chineese文本。即使我尝试outfile.write(line)它也会在输出中给出相同的废话。我只是不明白。
目的:我有一个男性姓氏的巨大文件。我需要获得与女性姓氏相同的文件。在俄语中它看起来像这样:Ivanov - Ivanova | Иванов - Иванова

2 个答案:

答案 0 :(得分:0)

尝试

lastname = str(line+prefix, 'utf-8')
outfile.write(lastname)

答案 1 :(得分:0)

所以@AndreyAtapin部分正确。我试图在一个文件中添加行,其中包含我之前与chineese字符的错误。即使刷新文件也无济于事。但是当我删除它并且脚本再次创建它时,它可以工作!感谢。