如何在nutch中索引文件名(和其他文件元数据)?

时间:2012-02-09 17:36:19

标签: java nutch

似乎nutch索引只(部分)解析结果。它运行索引过滤器,这些过滤器会破坏索引的内容。

这些索引过滤器将Parse结果作为参数。

如何实现文件名和其他文件元数据,例如所有者被编入索引?

当然我需要添加一个索引过滤器,但为了做到这一点,我还必须添加一个解析器来解析所有文件类型并获取它们的元数据?

1 个答案:

答案 0 :(得分:0)

详细信息(文件名,所有者)已经由代码处理,但我认为你需要对解析器稍作修改来存储这些细节