我最近下载了最新版本的nutch。 (nutch-1.1)在查看代码时,我注意到有一个conf / schema.xml文件,它定义了与nutch捆绑在一起的solr部分的模式。
此schema.xml包含每个插件的字段。 我的问题是,我如何找出特定插件重新调整的值?换句话说,如果我使用带有nutch的第三方插件(比如插件X)并想在schema.xml中添加几个字段,我该如何找出返回的“插件X”以及是否它是string,int,array?
我的第二个问题是,我看到conf / solrindex-mapping.xml,它是由nutch的solrIndexer使用的。这让我更加困惑,因为并非schema.xml中的所有字段都在solrindex-mapping.xml中
为了简单解释答案,我们假设插件X是与nutch捆绑的feed插件。