无法在Google应用引擎中使用TfidfVectorizer

时间:2014-04-19 10:55:49

标签: python google-app-engine scikit-learn

我正在Google App Engine中编写一个python程序,使用sklearn中的TfidfVectorizer计算tf-idf。

我添加了sklearn库并导入为:

from sklearn.feature_extraction.text import TfidfVectorizer

然而它给了我no module named _check_build,虽然它在我导入的库中。

注意:我在纯python中使用相同的代码并且它工作正常,因此python语法或导入没有任何问题;问题始于GAE。

您知道解决此问题的方法吗?

2 个答案:

答案 0 :(得分:4)

你不能。 sklearn有很多' c'基于依赖关系,通常使用前导_命名的任何模块都是二进制模块。

这就是为什么你收到module named _check_build错误的原因。

我严重怀疑即使你假装某些' c' libs,除非他们有纯粹的python类似物。

我过去曾经做过这样的事情,其中​​libs已经过去了。基于性能版本以及纯python。

答案 1 :(得分:0)

如果您未使用任何GAE专用工具,请尝试在Heroku上部署您的应用。 它允许您部署包含所有已安装库的整个虚拟环境。具体来说,Scikit-learn在Heroku上工作就好了。例如,请检查this Github repo