在大事务中安全地清除Hibernate会话

时间:2010-09-24 14:29:51

标签: java hibernate spring orm

我使用Spring + Hibernate进行操作,需要创建和更新数十万个项目。像这样:

{
   ...
   Foo foo = fooDAO.get(...);
   for (int i=0; i<500000; i++) {
      Bar bar = barDAO.load(i);
      if (bar.needsModification() && foo.foo()) {
         bar.setWhatever("new whatever");
         barDAO.update(bar);
         // commit here
         Baz baz = new Baz();
         bazDAO.create(baz);
         // if (i % 100 == 0), clear
      }
   }
}

为了保护自己免受中间变更的影响,我会在barDAO.update(bar)之后立即提交更改:

HibernateTransactionManager transactionManager = ...; // injected by Spring
DefaultTransactionDefinition def = new DefaultTransactionDefinition();
def.setPropagationBehavior(TransactionDefinition.PROPAGATION_REQUIRED);
TransactionStatus transactionStatus = transactionManager.getTransaction(def);
transactionManager.commit(transactionStatus);

此时我不得不说整个流程在包含在org.springframework.orm.hibernate3.support.ExtendedOpenSessionInViewFilter中的事务中运行(是的,这是一个webapp)。

这一切都运行良好,只有一个例外:经过几千次更新/提交后,整个过程变得非常慢,很可能是由于内存因Spring / Hibernate保留的不断增加的对象而膨胀。

在仅限Hibernate的环境中,通过调用org.hibernate.Session#clear()可以轻松解决这个问题。

现在,问题:

  • clear()什么时候开始?它的性能成本是否很高?
  • 为什么barbaz等对象不会自动发布/ GCd?在提交之后将它们保留在会话中有什么意义(在下一个迭代循环中它们无论如何都无法访问)?我没有做过记忆转储来证明这一点,但我的好感觉是它们一直存在直到完全退出。如果对此的回答是“Hibernate cache”,那么为什么缓存在可用内存不足时刷新?
  • 是否安全/建议直接调用org.hibernate.Session#clear()(考虑整个Spring上下文,延迟加载等事情)?是否有任何可用的Spring包装器/同类产品用于实现相同目的?
  • 如果对上述问题的回答是正确的,对象foo会发生什么,假设在循环内调用clear()?如果foo.foo()是延迟加载方法怎么办?

感谢您的回答。

2 个答案:

答案 0 :(得分:46)

  

何时是清除()的好时机?它的性能成本是否很高?

在刷新更改后,定期(理想情况下与JDBC批处理大小相同)。该文档描述了关于Batch processing

一章中的常用习语
  

13.1. Batch inserts

     

使新对象持久化   flush()然后清除()会话   定期以控制大小   第一级缓存。

Session session = sessionFactory.openSession();
Transaction tx = session.beginTransaction();

for ( int i=0; i<100000; i++ ) {
    Customer customer = new Customer(.....);
    session.save(customer);
    if ( i % 20 == 0 ) { //20, same as the JDBC batch size
        //flush a batch of inserts and release memory:
        session.flush();
        session.clear();
    }
}

tx.commit();
session.close();

这应该没有性能成本,au contraire:

  • 它允许保持跟踪物体的数量低(因此冲洗应该很快),
  • 它应该允许回收记忆。
  

为什么bar或baz等对象不会自动释放/ GCd?在提交之后将它们保留在会话中有什么意义(在下一个迭代循环中它们无论如何都无法访问)?

如果您不想保持跟踪实体,那么您需要明确地clear()会话,这就是它的工作方式(人们可能希望在不“丢失”实体的情况下提交事务)。

但是从我所看到的情况来看,bar和baz实例应该在明确之后成为GC的候选者。分析内存转储以查看正在发生的事情会很有趣。

  

安全/建议直接调用org.hibernate.Session #clear()

只要您flush()挂起的更改没有松开它们(除非这是您想要的),我没有看到任何问题(您的当前代码将松散每100个循环创建但可能它只是一些伪代码)。

  

如果对上述问题的回答是正确的,那么对象foo会发生什么,假设在循环内调用clear()?如果foo.foo()是一个延迟加载方法怎么办?

调用clear()Session驱逐所有已加载的实例,使其成为分离的实体。如果后续调用要求实体“附加”,则它将失败。

答案 1 :(得分:1)

我只想指出,在清除会话后,如果要继续使用会话中的某些对象,则必须Session.refresh(obj)才能继续。

否则您将收到以下错误:

org.hibernate.NonUniqueObjectException