打开文本文件作为textblob的输入

时间:2015-05-08 04:44:49

标签: python readfile textblob

我正在尝试将textBlob用于文本文件输入。

我在网上找到的所有例子都是这种意义上的输入:

wiki = TextBlob("Python is a high-level, general-purpose programming language.")
wiki.tage

我试过了:

from textblob import TextBlob
file=open("1.txt");
t=file.read();
print(type(t))
bobo = TextBlob(t)
bobo.tags

我试过的代码不起作用。

3 个答案:

答案 0 :(得分:1)

这是一个经典的Unicode issue

使用

import sys  

reload(sys)  
sys.setdefaultencoding('utf8')

然后阅读文件

通过这种方式,您可以使用UTF-8编码/解码格式

答案 1 :(得分:0)

您还可以查看Unidecode。

https://pypi.python.org/pypi/Unidecode

from unidecode import unidecode ... bobo = TextBlob(unidecode(t))

答案 2 :(得分:0)

对于Python3的人:

import sys  
from importlib import reload
reload(sys)  
sys.getdefaultencoding() # use this for Python3
from textblob import TextBlob
url ='filename.txt'
file=open(url)
t=file.read()
print(type(t))
bobo = TextBlob(t)
bobo.tags