标签: java nutch
似乎nutch索引只(部分)解析结果。它运行索引过滤器,这些过滤器会破坏索引的内容。
这些索引过滤器将Parse结果作为参数。
如何实现文件名和其他文件元数据,例如所有者被编入索引?
当然我需要添加一个索引过滤器,但为了做到这一点,我还必须添加一个解析器来解析所有文件类型并获取它们的元数据?
答案 0 :(得分:0)
详细信息(文件名,所有者)已经由代码处理,但我认为你需要对解析器稍作修改来存储这些细节