导入NLTK不适用于Hadoop Streaming

时间:2018-01-17 12:51:14

标签: hadoop nltk hadoop2 hadoop-streaming wordnet

我想在mapreduce程序中使用nltk数据,但是当我导入nltk并使用其中的函数时,它失败了。

我在一些论坛中读到我需要将所有nltk导入远程任务节点或类似的东西?

任何人都可以建议我在mapreduce程序中运行nltk函数的解决方案

谢谢

1 个答案:

答案 0 :(得分:0)

 nltk.data.path.append("/home/uname/nltk_data/")

您可以尝试使用上面的代码来指定NLTK搜索数据的路径。