通过帖子和您建议的解决方案,如下所示 - Which web crawler for extracting and parsing data from about a thousand of web sites
在/root/heritrix-1.14.4
下安装了heritrix坚持出口HERITRIX_HOME = / PATH / TO / BUILT / HERITRIX。
该命令以静默方式运行,但cd $ heritrix_home导致
-bash:cd:/root/heritrix-1.14.4/bin/heritrix:不是目录。
用google搜索失败了。
chmod u + x $ heritrix_home / bin / heritrix导致 chmod:无法访问`/root/heritrix-1.14.4/bin/heritrix/bin/heritrix':不是目录
您提出的宝贵指导/指示
答案 0 :(得分:1)
看起来HERITRIX_HOME设置为/root/heritrix-1.14.4/bin/heritrix,应将其设置为目录/root/heritrix-1.14.4