我试图根据http://sujitpal.blogspot.com/2009/07/nutch-custom-plugin-to-parse-and-add.html为Nutch编写一个插件来获取自定义标题查找器。
这很有效,将提取的标题存储在新字段中也没问题。但我想在Solr中使用它而不是默认标题。问题是Solr需要多值字段,因为我有2个标题字段。
metadata.remove( “标题”);
没有用。
我真的想使用新标题而不是Nutch创建的默认标题。有什么建议吗?
答案 0 :(得分:0)
为什么不将你的标题放在不同的字段中,这样才能正确处理?