我正在Google App Engine中编写一个python程序,使用sklearn中的TfidfVectorizer计算tf-idf。
我添加了sklearn库并导入为:
from sklearn.feature_extraction.text import TfidfVectorizer
然而它给了我no module named _check_build
,虽然它在我导入的库中。
注意:我在纯python中使用相同的代码并且它工作正常,因此python语法或导入没有任何问题;问题始于GAE。
您知道解决此问题的方法吗?
答案 0 :(得分:4)
你不能。 sklearn有很多' c'基于依赖关系,通常使用前导_
命名的任何模块都是二进制模块。
这就是为什么你收到module named _check_build
错误的原因。
我严重怀疑即使你假装某些' c' libs,除非他们有纯粹的python类似物。
我过去曾经做过这样的事情,其中libs已经过去了。基于性能版本以及纯python。
答案 1 :(得分:0)
如果您未使用任何GAE专用工具,请尝试在Heroku上部署您的应用。 它允许您部署包含所有已安装库的整个虚拟环境。具体来说,Scikit-learn在Heroku上工作就好了。例如,请检查this Github repo。