Nutch从DB读取自定义字段

时间:2017-01-02 17:01:37

标签: mongodb field nutch

我尝试使用Nutch + MongoDB + ES向ES索引添加自定义字段(我已经在Nutch updateDB步骤之后将自定义字段值添加到数据库中,以便能够在读取期间读取它们索引步骤)。 我已经更新了webpage.avsc,为新字段生成了WebPage源(ant generate-gora-src)和更新的gora-mongodb-mapping.xml。通过这样做,我认为我会在WebPage实例,NutchDocument以及索引中看到新字段但不幸的是发生了什么: - 新的字段存在于WebPage中但具有空值(我在数据库中检查过,它没有空值) - NutchDocument上没有新字段(我知道我可以通过编写新插件来添加它) - 索引中不存在新字段 您是否知道为什么不将新字段从数据库读取到WebPage?我错过了什么吗?

非常感谢

0 个答案:

没有答案