如何使用lucene hibernate搜索索引已经创建的数据库

时间:2017-10-26 17:11:54

标签: java hibernate lucene hibernate-search

我有一个包含现有数据的数据库,我想使用Lucene Hibernate进行索引。当我创建新数据时,Hibernate会对其进行索引,但问题是:如何索引数据库中的所有旧数据?

这是我的persistence.xml文件:

<persistence xmlns="http://java.sun.com/xml/ns/persistence"
    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" version="2.0"
    xsi:schemaLocation="http://java.sun.com/xml/ns/persistence http://java.sun.com/xml/ns/persistence/persistence_2_0.xsd">
  <persistence-unit name="persistenceUnit"
      transaction-type="RESOURCE_LOCAL">
    <provider>org.hibernate.jpa.HibernatePersistenceProvider</provider>
    <properties>
      <property name="hibernate.dialect" value="com.zodiac.qtp.domain.MySQL5CustomInnoDBDialect"/>
      <!-- value="create" to build a new database on each run; value="update"
      to modify an existing database; value="create-drop" means the same as "create"
      but also drops tables when Hibernate closes; value="validate" makes no changes
      to the database -->
      <property name="hibernate.format_sql" value="true"/>
      <property name="hibernate.hbm2ddl.auto" value="update" />
      <property name="hibernate.ejb.naming_strategy" value="org.hibernate.cfg.ImprovedNamingStrategy" />
      <property name="hibernate.connection.charSet" value="UTF8" />
      <property name="hibernate.connection.characterEncoding" value="UTF8"/>
      <property name="hibernate.show_sql" value="false" />
      <property name="hibernate.cache.provider_class"  value="org.hibernate.cache.EhCacheProvider"/>
      <property name="hibernate.cache.use_second_level_cache" value="true" />
      <property name="hibernate.cache.use_query_cache" value="true" />
      <property name="hibernate.generate_statistics" value="false" />
      <property name="hibernate.cache.region.factory_class" value="org.hibernate.cache.ehcache.SingletonEhCacheRegionFactory" />
      <!-- Uncomment the following two properties for JBoss only -->
      <!-- property name="hibernate.validator.apply_to_ddl" value="false" / -->
      <!-- property name="hibernate.validator.autoregister_listeners" value="false" / -->
      <property name="hibernate.search.default.directory_provider" value="org.hibernate.search.store.impl.FSDirectoryProvider"/>
      <property name="hibernate.search.default.indexBase" value="C:\ZAM_DEV\QTPGenerator-repository\lucene-indexes-v2"/>
    </properties>
  </persistence-unit>
</persistence>

2 个答案:

答案 0 :(得分:2)

简短的回答是索引是自动的:Hibernate Search会在每次实体通过Hibernate ORM持久化,更新或删除时透明地为每个实体编制索引。它的任务是保持索引和数据库同步,让你忘记这个问题。

但是,在现有应用程序中引入Hibernate Search时,必须为数据库中已存在的数据创建初始Lucene索引。

添加上述属性和注释后,如果数据库中有现有数据,则需要触发图书的初始批量索引。这将重建您的索引以确保您的索引和数据库同步。您可以使用以下代码段之一来实现此目的(另请参阅重建整个索引):

使用Hibernate会话重建索引

FullTextSession fullTextSession = Search.getFullTextSession(session);
fullTextSession.createIndexer().startAndWait();

使用EntityManager(JPA)重建索引

FullTextEntityManager fullTextEntityManager = 
Search.getFullTextEntityManager(entityManager);
fullTextEntityManager.createIndexer().startAndWait();

执行上述代码后,您应该能够在/var/lucene/indexes/example.Book下看到Lucene索引。

存储路径的根取决于我们在配置步骤中指定的配置属性hibernate.search.default.indexBase。

您现在可以使用Luke检查此索引。它将帮助您了解Hibernate Search的工作原理:Luke允许您检查索引内容和结构,类似于使用SQL控制台检查关系数据库上Hibernate ORM的工作方式。

答案 1 :(得分:0)

persistence.xml file is to access entities from your DB的目的。它实际上并没有对底层索引说太多,你也无法使用这个文件创建数据库索引。要创建索引,必须以管理员身份登录到数据库服务器,并使用相应的CREATE INDEX命令创建索引。