我有这段代码:
# -*- coding: utf-8 -*-
import codecs
prefix = u"а"
rus_file = "rus_names.txt"
output = "rus_surnames.txt"
with codecs.open(rus_file, 'r', 'utf-8') as infile:
with codecs.open(output, 'a', 'utf-8') as outfile:
for line in infile.readlines():
outfile.write(line+prefix)
它在输出文件中给了我一些chineese文本。即使我尝试outfile.write(line)
它也会在输出中给出相同的废话。我只是不明白。
目的:我有一个男性姓氏的巨大文件。我需要获得与女性姓氏相同的文件。在俄语中它看起来像这样:Ivanov - Ivanova | Иванов - Иванова
答案 0 :(得分:0)
尝试
lastname = str(line+prefix, 'utf-8')
outfile.write(lastname)
答案 1 :(得分:0)
所以@AndreyAtapin部分正确。我试图在一个文件中添加行,其中包含我之前与chineese字符的错误。即使刷新文件也无济于事。但是当我删除它并且脚本再次创建它时,它可以工作!感谢。