标签: nutch
在nutch-site.xml的{{1}}标题下,当我写plugin-includes时,它是什么意思?
nutch-site.xml
plugin-includes
这是否意味着nutch正在获取每个url,nutch首先使用parse-(type1|type2) 1解析器解析内容,然后依次调用type解析器?
parse-(type1|type2)
type
答案 0 :(得分:1)
你的假设是正确的。这是它的工作原理。但请记住,每个插件都可以分配一定的内容类型或一组内容类型。例如,parse-pdf插件不会解析msword文档。