PYTHON文本编码 - 从文件中读取并写入文件

时间:2015-08-26 21:51:05

标签: python encoding character-encoding

我想从文件中读取一些文本字符串并将其保存回另一个文件字符串,但我面临的事实是文本处于编码状态,对我来说没用 - 这是输入文件结构的示例:

  • ABEBA
  • abeced \xe1ř
  • abecedně
  • abecednictv \固定的
  • 阿贝尔

通过我的脚本处理后所需的输出应该是这样的:

  • ABEBA
  • abecedář
  • abecedně
  • abecednictví
  • 阿贝尔

这是我的代码,我正在尝试编辑以某种方式工作,但我只获得完全UTF编码的字符串或一些错误:

`import unicodedata
import re

wordlist = open('C:/Administrace/Python/inputs/test_input.txt', 'r')
wordlist_edited = open('C:/Administrace/Python/inputs/test_output.txt', 'wb')

while (end == "false"):
    output = wordlist.readline()

output_edited2 = output_edited.encode('utf-8')

    wordlist_edited.write(output_edited2)
    if output == '': end = "true"
    print (output_edited2)

`

我觉得应该很容易,但我是Python的新手...; - )

非常感谢您的帮助!

问候,亚当

0 个答案:

没有答案