标签: solr nutch
我有一个应用程序使用Apache Nutch 2.1抓取网站并将数据保存到MySQL。我必须整合Nutch和Solr这不是问题,因为互联网上有足够的文档。
从网页存储内容后,我想添加一个基于Solr的搜索功能。我需要在网页中搜索关键词。例如,如果我正在抓取与电影相关的网站,并且我想从已爬网数据中搜索任何特定电影(作为关键字),那么我需要对Solr配置进行哪些更改。我是否需要完全编写一个单独的插件,或者我可以使用现有的插件?我必须在solr配置中添加什么类型的索引?