使用Heritrix 1.14

时间:2010-11-16 15:52:50

标签: unix shell installation

通过帖子和您建议的解决方案,如下所示 - Which web crawler for extracting and parsing data from about a thousand of web sites

在/root/heritrix-1.14.4

下安装了heritrix

坚持出口HERITRIX_HOME = / PATH / TO / BUILT / HERITRIX。

该命令以静默方式运行,但cd $ heritrix_home导致

-bash:cd:/root/heritrix-1.14.4/bin/heritrix:不是目录。

用google搜索失败了。

chmod u + x $ heritrix_home / bin / heritrix导致 chmod:无法访问`/root/heritrix-1.14.4/bin/heritrix/bin/heritrix':不是目录

您提出的宝贵指导/指示

1 个答案:

答案 0 :(得分:1)

看起来HERITRIX_HOME设置为/root/heritrix-1.14.4/bin/heritrix,应将其设置为目录/root/heritrix-1.14.4