我正在尝试使用Gumbo的python包装器来解析HTML。
我的操作系统是Ubuntu 14.04.3 LTS。我正在使用Python2.7
我从github克隆了最新版本的Gumbo。
我按照Github上提供的安装步骤进行操作。
库的安装,包括C库和python包装器,似乎都是成功的(没有错误信息,最后都打印成功的消息)
C库最终消息:
库已安装在:/ usr / local / lib
中
Python包装器消息:
已安装 /usr/local/lib/python2.7/dist-packages/gumbo-0.10.1-py2.7.egg 处理gumbo的依赖关系== 0.10.1完成处理 gumbo的依赖关系== 0.10.1
我遇到的第一个问题是当我尝试打开pydoc for gumbo时,为了更好地理解库。
pydoc gumbo
产生了以下错误:
problem in gumbo - <type 'exceptions.OSError'>: /usr/local/lib/python2.7/dist-packages/gumbo-0.10.1-py2.7.egg/gumbo/libgumbo.so: cannot open shared object file: No such file or directory
搜索邮件产生了一个result。
对我来说没什么用处。
查看dist-packages目录,我注意到libgumbo.so不在/usr/local/lib/python2.7/dist-packages/gumbo-0.10.1-py2.7.egg/gumbo/
中。然而,所有其他文件(soup-adapter.py,gumboc.py等)。
C库的安装在/usr/local/lib
中放置了libgumbo.so(以及其他一些库,如libgumbo.a libgumbo.la等)。因此,作为解决方法,我创建了一个从.../dist-packages/gumbo-0.10.1-py2.7.egg/gumbo/
到/usr/local/lib
的simlink。
这让pydoc浓汤起作用了。
我尝试在翻译后导入浓汤和汤适配器。我收到以下错误:
import soup_adapter
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "soup_adapter.py", line 26, in <module>
import gumboc
File "gumboc.py", line 44, in <module>
os.path.dirname(__file__), _name_of_lib))
File "/usr/lib/python2.7/ctypes/__init__.py", line 443, in LoadLibrary
return self._dlltype(name)
File "/usr/lib/python2.7/ctypes/__init__.py", line 365, in __init__
self._handle = _dlopen(self._name, mode)
OSError: libgumbo.so: cannot open shared object file: No such file or directory
我不知道如何进行或如何让浓汤工作。