Thinbug
News
是否有可能让Nutch爬行远程Windows机器forlders?
时间:2016-01-20 14:19:03
标签:
nutch
我会打破这个问题:
Nutch是否可以抓取文件夹/子文件夹/文件?
如果是,Nutch是否可以抓取远程Windows文件夹?
如果是,我们如何配置?
醇>
或者Nutch只适用于网页抓取?
谢谢。
1 个答案:
答案 0 :(得分:0)
如果可以通过浏览器访问这些文件,Nutch可以抓取文件。
相关问题
如何制作nutch抓取文件系统?
如何让nutch履带爬行
是否可以让Nutch只爬下某个文件路径?
Nutch:Crawl Broken Links&在Solr中索引它
是否有可能让Nutch爬行远程Windows机器forlders?
如何让Nutch爬虫只抓取特定的URL?
使用nutch crawl,如果我为-topN和-depth使用较小的值,它是否仍会抓取所有相同的页面?
在Nutch中可以有不同的获取间隔吗?
关于Nutch抓取经过身份验证的网站
Nutch 1.13花费的时间太长
最新问题
我写了这段代码,但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值,但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场?
是否有可能使 loadstring 不可能等于打印?卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用?
在此代码中是否有使用“this”的替代方法?
在 SQL Server 和 PostgreSQL 上查询,我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源?