Question

我已经搜索了数小时来修复此错误，但是没有一个在线解决方案可以解决我的问题。

在Python 3.6上执行这段代码时：

# encoding=utf-8
f = open("x.htm", "r", -1, "utf-8", 'ignore') 
s = f.read()
print(s)

我收到以下错误：UnicodeEncodeError：'ascii'编解码器无法在位置37编码字符'\ xfc'：序数不在范围（128）中

我什至不知道为什么要使用ascii编解码器？

我使用的是普通的html文件，该文件中仅包含utf-8字符，这些字符也已指定为字符集（在通过通用浏览器打开时看起来很正常）

我已经找到了解决方法：

s = f.read().encode('utf-8').decode("ascii", "ignore")

到目前为止，问题是由于使用了替换标签时，忽略标签导致的数据丢失，而发生以下错误：

UnicodeEncodeError：“ ascii”编解码器无法在位置37-38处编码字符：序数不在范围（128）中

我有一个普通的html文件，该文件可以由我的浏览器和编辑器正确解码为utf-8，我尝试使用utf-8在python中打开此文件-然后出现ascii的unicode错误？

Answer 1

您可以执行以下操作

检查使用ascii的编辑器，并找出故障点。打开vim并搜索问题字符