这可能是一个非常基本的解决方案,但我已经潜入了每个在线试图解决这个问题的例子。我正在使用Python 3.4加载文本文件,如下所示:
text = open("/Users/Stu/python/extext.txt")
text = unidecode(text)
text = open(text, "r").read()
然后我被抛出这个错误:
Traceback (most recent call last):
File "/Users/Stu/Twitter Python/Victoria.py", line 46, in <module>
short_pos = unidecode(short_pos)
File "/Library/Frameworks/Python.framework/Versions/3.4/lib/python3.4/site-packages/unidecode/__init__.py", line 37, in unidecode
for char in string:
File "/Library/Frameworks/Python.framework/Versions/3.4/lib/python3.4/encodings/ascii.py", line 26, in decode
return codecs.ascii_decode(input, self.errors)[0]
UnicodeDecodeError: 'ascii' codec can't decode byte 0xf3 in position 4645: ordinal not in range(128)
我假设它找到了一个无法解码的角色,但本文档中的所有内容都是英文和基本的标点符号。我们非常感谢你们给予的任何支持。
干杯!
答案 0 :(得分:1)
这似乎让我可以阅读文字:
short_pos = open("/Users/Stu/Twitter Python/short_reviews/positive1.txt","r", encoding = "latin-1").read()
感谢大家的支持!