我正在尝试将Python Boilerpipe置于我的Ubuntu 14中。它失败并出现以下错误:
Traceback (most recent call last):
File "setup.py", line 27, in <module>
download_jars(datapath=DATAPATH)
File "setup.py", line 21, in download_jars
tar = tarfile.open(tgz_name, mode='r:gz')
File "/usr/lib/python2.7/tarfile.py", line 1678, in open
return func(name, filemode, fileobj, **kwargs)
File "/usr/lib/python2.7/tarfile.py", line 1730, in gzopen
raise ReadError("not a gzip file")
tarfile.ReadError: not a gzip file
以下是我要遵循的步骤:
答案 0 :(得分:3)
发现问题,所以在setup.py中他们正在寻找锅炉管道tar文件。他们从googlecode下载它,不再存在了。
def download_jars(datapath, version=boilerpipe_version):
tgz_url = 'https://boilerpipe.googlecode.com/files/boilerpipe-{0}- bin.tar.gz'.format(version)
所以我用新的文件位置替换了同一行:
tgz_url='https://storage.googleapis.com/google-code-archive-downloads/v2/code.google.com/boilerpipe/boilerpipe-1.2.0-bin.tar.gz'
这对我有用。
答案 1 :(得分:0)
您可以使用任何类似替代方案之一,例如try jusText
pip install justext
以下是一些替代方案: