配置Solr以索引seed.txt中包含的元数据

时间:2016-01-17 00:50:45

标签: solr field metadata nutch

我目前正在运行Nutch 1.10和solr 5.3.1,我正在尝试抓取并索引一些网站。这些站点具有关联的id和名称(与seed.txt文件中的url位于同一行),我希望将其包含在solr搜索结果中的其他字段(例如主机,段等)中。这可能吗?如果是这样,我是否需要修改除seed.txt和schema-solr4以外的任何文件?

我在seed.txt中的例子:

www.exampleSite.com id = 3 name = exampleSite

0 个答案:

没有答案