Boilerpipe是一个很棒的Java程序,用于清理网页,我过去曾经使用它。我今天注意到许多用户无法安装Python包装器版本并获得404和其他错误。这是我从conda复制的一次尝试。
/ Users / duncan> sudo -H pip install https://pypi.python.org/packages/source/b/boilerpipe-py3/boilerpipe-py3-1.2.0.0.tar.gz 收集https://pypi.python.org/packages/source/b/boilerpipe-py3/boilerpipe-py3-1.2.0.0.tar.gz 正在下载boilerpipe-py3-1.2.0.0.tar.gz(1.3MB) 100%|████████████████████████████████| 1.3MB 436kB / s 从命令python setup.py egg_info完成输出: Traceback(最近一次调用最后一次): 文件“”,第1行,in 文件“/tmp/pip-r6swd0hy-build/setup.py”,第33行,in download_jars(数据路径= DATAPATH) 在download_jars中输入文件“/tmp/pip-r6swd0hy-build/setup.py”,第26行 urlretrieve(tgz_url,tgz_name) urlretrieve中的文件“/Users/duncan/anaconda/lib/python3.5/urllib/request.py”,第188行 使用contextlib.closing(urlopen(url,data))作为fp: 文件“/Users/duncan/anaconda/lib/python3.5/urllib/request.py”,第163行,在urlopen中 return opener.open(url,data,timeout) 文件“/Users/duncan/anaconda/lib/python3.5/urllib/request.py”,第472行,公开 response = meth(req,response) 在http_response中输入文件“/Users/duncan/anaconda/lib/python3.5/urllib/request.py”,第582行 'http',请求,响应,代码,消息,hdrs) 文件“/Users/duncan/anaconda/lib/python3.5/urllib/request.py”,第510行,出错 return self._call_chain(* args) 在_call_chain中输入文件“/Users/duncan/anaconda/lib/python3.5/urllib/request.py”,第444行 result = func(* args) 在http_error_default中输入文件“/Users/duncan/anaconda/lib/python3.5/urllib/request.py”,第590行 引发HTTPError(req.full_url,code,msg,hdrs,fp) urllib.error.HTTPError:HTTP错误404:未找到
----------------------------------------
命令“python setup.py egg_info”失败,错误代码1在/ tmp / pip-r6swd0hy-build /
我见过几个对我不起作用的解决方案(例如:google更改了模块的URL)如果有人有解决方案,我将非常感激!
我的平台是一个16GB的El Capitan,但我在Ubuntu和其他平台上看到过这个。感谢您的帮助!
答案 0 :(得分:1)
我只是将boilerpipe-1.2.0-bin.tar.gz从这里code.google.com分叉并重新下载到我的存储库https://github.com/slaveofcode/boilerpipe3
您可以使用pip
安装samppipepip install boilerpipe3
或通过项目存储库
pip install git+ssh://git@github.com/slaveofcode/boilerpipe3@master
答案 1 :(得分:0)
我遇到了同样的问题,这是因为已经移动了套管网址。我通过改变来自pypi的安装tar.gz中的setup.py中的这一行来解决这个问题:
旧行:
tgz_url = 'https://boilerpipe.googlecode.com/files/boilerpipe-{0}-bin.tar.gz'.format(version)
新行:
的 tgz_url = 'https://storage.googleapis.com/google-code-archive-downloads/v2/code.google.com/boilerpipe/boilerpipe-{0}-bin.tar.gz'.format(version)
强>
重新压缩整个文件夹并在新的压缩目录上运行pip install。