我试图用python处理韩文文本,但是当我尝试用utf-8编码文件时它失败了。
=============================================================
Traceback (most recent call last):
File "C:\Users\******\Desktop\tagging.py", line 5, in <module>
f = open('tag.txt', 'r', encoding='utf=8')
TypeError: 'encoding' is an invalid keyword argument for this function
[Finished in 0.1s]
==================================================================
{{1}}
当我刚打开一个用utf-8编码的韩文txt文件时,字体会像这样破坏。我该怎么办?
\ XC1 \ XC1 \ XBE \ XC6 \ XC1 \ XF6 \ XB4 \ XC2 \ n&#39 ;, &#39; \ XC1 \ XC1 \ XBE \ XC6 \ xc7 \ XCF \ XB0 \ XC5 \ XB5 \ XE7 \ XBF \ XE4 \ n&#39 ;, &#39; \ XC1 \ XC1 \ XBE \ XC6 \ xc7 \ XCF \ XBD \ XC3 \ XB4 \ XC2 \ n&#39 ;, &#39; \ XC1 \ XCB \ XBC \ XDB \ xc7 \ XD1 \ XB5 \ xa5 \ XBF \ XE4 \ n&#39 ;, &#39; \ XC1 \ XD6 \ XB1 \ XB8 \ XBF \ XE4 \
答案 0 :(得分:0)
在Python 2中,open function不接受编码参数。相反,您读取一行并将其转换为unicode。厨房(如厨房水槽)模块中的article提供了详细信息和一些轻量级实用程序,可以在python 2.x中使用unicode。
答案 1 :(得分:0)
我不懂韩语,也没有样本字符串试试,但这里有一些建议:
1
f = open('tag.txt', 'r', encoding='utf=8')
这里有一个拼写错误,utf-8
而不是utf=8
,这解释了你得到的例外情况。
默认模式open()
为'r',因此您无需再次定义。
2不要只使用open
,您应该使用context manager语句来管理打开/关闭文件描述符,如下所示:
with open('tagresult.txt', 'w') as f:
f.write(s)