在hibernate Search中索引文件内容的最佳实践

时间:2015-01-13 08:41:48

标签: java spring lucene cxf hibernate-search

我正在使用CXF和Spring以及Hibernate Search。

我有一个Main类,它有几个属性,其中一个属性是Attachment(File)类型。我将所有属性存储在数据库中,除了我将存储在文件系统上的附件(文件)。

所以现在我的问题是:

如果用户提供了一些附件(文件内容)字符串,那么我应该返回主要类的对象,其附件(文件)包含这些给定的字符串。

那么我应该如何使用文件内容的索引来实现我的要求。

请建议我以优化的方式做到这一点。

1 个答案:

答案 0 :(得分:0)

如果您需要使用Apache Tika 从pdf,doc等文件中提取,则可以实现此目的。任何方式只需为您的文件写字段桥。

public class FileContentBridge implements StringBridge {

   public String objectToString(Object object) {

     //extract file content 
      return "extracted";
   }
}

应用桥梁

@FieldBridge(impl = FileContentBridge.class)
private File attachment;