我有一个与NLP课程相关的项目,该课程即将用阿拉伯语对口语方言进行分类。我需要从不同的域中删除大量数据才能正常训练。
我使用Eclipse IDE(使用PyDev32)在Windows 10 64位上使用Python 2.7
,我发现的最受欢迎且最有效的框架是Scrapy
我已按照所有安装步骤仔细:
使用
pip install scrapy
安装时,会输出NO error但是当我开始一个项目或执行
scrapy shell "google.com"
时,我得到了错误(最后四行):
from OpenSSL._util import (
File "c:\python27\lib\site-packages\OpenSSL\_util.py", line 6, in <module>
from cryptography.hazmat.bindings.openssl.binding import Binding
File "c:\python27\lib\site-packages\cryptography\hazmat\bindings\openssl\binding.py", line 14, in <module>
from cryptography.hazmat.bindings._openssl import ffi, lib
ImportError: DLL load failed: %1 is not a valid Win32 application.
另一个错误:
Could not find function xmlCheckVersion in library libxml2. Is libxml2 installed?
注意:
我正在使用32位Python,因为我注意到(在谷歌搜索之后)Scrapy无法在64位上运行
我在Stack Overflow上找到了很多解决方案,但都是徒劳的,所以我的问题不是重复
我试图打开/关闭防火墙,没有任何好处
我安装了两个版本的OpenSSL(32位/ 64位)并且没有任何修复
我认为问题出在lxml
但与之无关。
我是初学者,我的项目应该在不到一周的时间内完成
我在Anaconda上测试运行scrapy
(正如他们推荐的那样),我也遇到了同样的错误
对于我的谦虚问题,我很抱歉,我很乐意得到任何人的帮助:)
答案 0 :(得分:0)
您最有可能遇到lxml
依赖性问题,这在Windows系统上很难编译。
您可以做的最好的事情是将其二进制文件安装为mentioned in the official docummentation
您可以直接下载非官方二进制文件from here