Question

我有这段代码：

# -*- coding: utf-8 -*-
import codecs
prefix = u"а"

rus_file = "rus_names.txt"
output = "rus_surnames.txt"

with codecs.open(rus_file, 'r', 'utf-8') as infile:
    with codecs.open(output, 'a', 'utf-8') as outfile:
        for line in infile.readlines():
        outfile.write(line+prefix)

它在输出文件中给了我一些chineese文本。即使我尝试outfile.write(line)它也会在输出中给出相同的废话。我只是不明白。
目的：我有一个男性姓氏的巨大文件。我需要获得与女性姓氏相同的文件。在俄语中它看起来像这样：Ivanov - Ivanova | Иванов - Иванова

Answer 1

尝试

lastname = str(line+prefix, 'utf-8')
outfile.write(lastname)

Answer 2

所以@AndreyAtapin部分正确。我试图在一个文件中添加行，其中包含我之前与chineese字符的错误。即使刷新文件也无济于事。但是当我删除它并且脚本再次创建它时，它可以工作！感谢。

处理俄语文本文件失败

2 个答案: