Tokenize不使用任何字符串输入

时间:2017-08-16 10:27:46

标签: python string nltk typeerror tokenize

我之前发布了一个我从链接中提取的字符串,我想为其应用tokenize,没有运气。所以试过一个简化的例子: 我的命令行非常简单:

a="Any Random text at all , nothing freaking works"
sentences = nltk.sent_tokenize(a)

我一直得到:

TypeError: Can't convert 'list' object to str implicitly

我已尝试str.(a)a.splita=a[0]并检查:

>>> type(a)
<class 'str'>

我的Python出了什么问题?我检查了一些例子,这显然应该有效。如果有人可以运行并看看他们是否获得结果,那将非常感激,如果有的话,我的Python可能出现了什么问题

Added image of error

1 个答案:

答案 0 :(得分:1)

这是nltk包本身的问题。如图所示,它不是传入的参数,而是['']中的文字nltk/data.py,它被认为是列表并转换为字符串。

重新安装nltk包可能有帮助吗?

显示nltk/data.py的第69行,path = []