标签: solr field metadata nutch
我目前正在运行Nutch 1.10和solr 5.3.1,我正在尝试抓取并索引一些网站。这些站点具有关联的id和名称(与seed.txt文件中的url位于同一行),我希望将其包含在solr搜索结果中的其他字段(例如主机,段等)中。这可能吗?如果是这样,我是否需要修改除seed.txt和schema-solr4以外的任何文件?
我在seed.txt中的例子:
www.exampleSite.com id = 3 name = exampleSite