使用utf-8编码韩文txt文件

时间:2016-08-07 23:45:03

标签: python encoding utf-8

我试图用python处理韩文文本,但是当我尝试用utf-8编码文件时它失败了。

=============================================================
Traceback (most recent call last):
  File "C:\Users\******\Desktop\tagging.py", line 5, in <module>
    f = open('tag.txt', 'r', encoding='utf=8')
TypeError: 'encoding' is an invalid keyword argument for this function
[Finished in 0.1s]

==================================================================
{{1}}

当我刚打开一个用utf-8编码的韩文txt文件时,字体会像这样破坏。我该怎么办?

  

\ XC1 \ XC1 \ XBE \ XC6 \ XC1 \ XF6 \ XB4 \ XC2 \ n&#39 ;,   &#39; \ XC1 \ XC1 \ XBE \ XC6 \ xc7 \ XCF \ XB0 \ XC5 \ XB5 \ XE7 \ XBF \ XE4 \ n&#39 ;,   &#39; \ XC1 \ XC1 \ XBE \ XC6 \ xc7 \ XCF \ XBD \ XC3 \ XB4 \ XC2 \ n&#39 ;,   &#39; \ XC1 \ XCB \ XBC \ XDB \ xc7 \ XD1 \ XB5 \ xa5 \ XBF \ XE4 \ n&#39 ;,   &#39; \ XC1 \ XD6 \ XB1 \ XB8 \ XBF \ XE4 \

2 个答案:

答案 0 :(得分:0)

在Python 2中,open function不接受编码参数。相反,您读取一行并将其转换为unicode。厨房(如厨房水槽)模块中的article提供了详细信息和一些轻量级实用程序,可以在python 2.x中使用unicode。

答案 1 :(得分:0)

我不懂韩语,也没有样本字符串试试,但这里有一些建议:

1

f = open('tag.txt', 'r', encoding='utf=8')

这里有一个拼写错误,utf-8而不是utf=8,这解释了你得到的例外情况。

默认模式open()为'r',因此您无需再次定义。

2不要只使用open,您应该使用context manager语句来管理打开/关闭文件描述符,如下所示:

with open('tagresult.txt', 'w') as f:
    f.write(s)