读取非ASCII字符的文件

时间:2019-05-23 21:32:07

标签: python unicode encoding

我正在尝试读取包含非ASCII字符的文本文件。但是,似乎文件的元素不是unicode。

# fixed resizing and distort aspect ratio 
# to be 300px but compute the new height based on the aspect ratio
image = cv2.imread("my_image.jpg") # src
(h, w, d) = image.shape
print("width={}, height={}, depth={}".format(w, h, d))
r = 300.0 / w
dim = (300, int(h * r))
resized = cv2.resize(image, dim)
cv2.imshow("Aspect Ratio Resize", resized)

它产生以下输出:

# -*- coding: utf-8 -*-
from __future__ import unicode_literals



with open("/home/biswadip/Desktop/test", "r") as f:
    content = f.read().splitlines()
print(content)
a= content[0]
print(type(a))

现在,因为它不是unicode字符串,所以我无法执行常规操作,例如向其中添加另一个字符串。它产生“'ascii'编解码器无法解码”错误。我以为['\xc2\xb0', 'a', 'b'] <type 'str'> 应该可以解决这个问题,但是显然,它没有用。我知道我可以使用reload(sys)重新加载系统并将默认编码设置为utf-8,但是我认为这不是可行的解决方案。

0 个答案:

没有答案