读取.txt文件

时间:2015-09-11 16:57:53

标签: python decode utf

这可能是一个非常基本的解决方案,但我已经潜入了每个在线试图解决这个问题的例子。我正在使用Python 3.4加载文本文件,如下所示:

text = open("/Users/Stu/python/extext.txt")
text = unidecode(text)
text = open(text, "r").read()

然后我被抛出这个错误:

Traceback (most recent call last):
  File "/Users/Stu/Twitter Python/Victoria.py", line 46, in <module>
    short_pos = unidecode(short_pos)
  File "/Library/Frameworks/Python.framework/Versions/3.4/lib/python3.4/site-packages/unidecode/__init__.py", line 37, in unidecode
    for char in string:
  File "/Library/Frameworks/Python.framework/Versions/3.4/lib/python3.4/encodings/ascii.py", line 26, in decode
    return codecs.ascii_decode(input, self.errors)[0]
UnicodeDecodeError: 'ascii' codec can't decode byte 0xf3 in position 4645: ordinal not in range(128)

我假设它找到了一个无法解码的角色,但本文档中的所有内容都是英文和基本的标点符号。我们非常感谢你们给予的任何支持。

干杯!

1 个答案:

答案 0 :(得分:1)

这似乎让我可以阅读文字:

short_pos = open("/Users/Stu/Twitter Python/short_reviews/positive1.txt","r", encoding = "latin-1").read()

感谢大家的支持!