我正在尝试将textBlob用于文本文件输入。
我在网上找到的所有例子都是这种意义上的输入:
wiki = TextBlob("Python is a high-level, general-purpose programming language.")
wiki.tage
我试过了:
from textblob import TextBlob
file=open("1.txt");
t=file.read();
print(type(t))
bobo = TextBlob(t)
bobo.tags
我试过的代码不起作用。
答案 0 :(得分:1)
这是一个经典的Unicode issue
使用
import sys
reload(sys)
sys.setdefaultencoding('utf8')
然后阅读文件
通过这种方式,您可以使用UTF-8
编码/解码格式
答案 1 :(得分:0)
您还可以查看Unidecode。
https://pypi.python.org/pypi/Unidecode
from unidecode import unidecode
...
bobo = TextBlob(unidecode(t))
答案 2 :(得分:0)
对于Python3的人:
import sys
from importlib import reload
reload(sys)
sys.getdefaultencoding() # use this for Python3
from textblob import TextBlob
url ='filename.txt'
file=open(url)
t=file.read()
print(type(t))
bobo = TextBlob(t)
bobo.tags