我使用Spring + Hibernate进行操作,需要创建和更新数十万个项目。像这样:
{
...
Foo foo = fooDAO.get(...);
for (int i=0; i<500000; i++) {
Bar bar = barDAO.load(i);
if (bar.needsModification() && foo.foo()) {
bar.setWhatever("new whatever");
barDAO.update(bar);
// commit here
Baz baz = new Baz();
bazDAO.create(baz);
// if (i % 100 == 0), clear
}
}
}
为了保护自己免受中间变更的影响,我会在barDAO.update(bar)
之后立即提交更改:
HibernateTransactionManager transactionManager = ...; // injected by Spring
DefaultTransactionDefinition def = new DefaultTransactionDefinition();
def.setPropagationBehavior(TransactionDefinition.PROPAGATION_REQUIRED);
TransactionStatus transactionStatus = transactionManager.getTransaction(def);
transactionManager.commit(transactionStatus);
此时我不得不说整个流程在包含在org.springframework.orm.hibernate3.support.ExtendedOpenSessionInViewFilter
中的事务中运行(是的,这是一个webapp)。
这一切都运行良好,只有一个例外:经过几千次更新/提交后,整个过程变得非常慢,很可能是由于内存因Spring / Hibernate保留的不断增加的对象而膨胀。
在仅限Hibernate的环境中,通过调用org.hibernate.Session#clear()
可以轻松解决这个问题。
现在,问题:
clear()
什么时候开始?它的性能成本是否很高?bar
或baz
等对象不会自动发布/ GCd?在提交之后将它们保留在会话中有什么意义(在下一个迭代循环中它们无论如何都无法访问)?我没有做过记忆转储来证明这一点,但我的好感觉是它们一直存在直到完全退出。如果对此的回答是“Hibernate cache”,那么为什么缓存在可用内存不足时刷新?org.hibernate.Session#clear()
(考虑整个Spring上下文,延迟加载等事情)?是否有任何可用的Spring包装器/同类产品用于实现相同目的?foo
会发生什么,假设在循环内调用clear()
?如果foo.foo()
是延迟加载方法怎么办?感谢您的回答。
答案 0 :(得分:46)
何时是清除()的好时机?它的性能成本是否很高?
在刷新更改后,定期(理想情况下与JDBC批处理大小相同)。该文档描述了关于Batch processing:
一章中的常用习语13.1. Batch inserts
使新对象持久化 flush()然后清除()会话 定期以控制大小 第一级缓存。
Session session = sessionFactory.openSession(); Transaction tx = session.beginTransaction(); for ( int i=0; i<100000; i++ ) { Customer customer = new Customer(.....); session.save(customer); if ( i % 20 == 0 ) { //20, same as the JDBC batch size //flush a batch of inserts and release memory: session.flush(); session.clear(); } } tx.commit(); session.close();
这应该没有性能成本,au contraire:
为什么bar或baz等对象不会自动释放/ GCd?在提交之后将它们保留在会话中有什么意义(在下一个迭代循环中它们无论如何都无法访问)?
如果您不想保持跟踪实体,那么您需要明确地clear()
会话,这就是它的工作方式(人们可能希望在不“丢失”实体的情况下提交事务)。
但是从我所看到的情况来看,bar和baz实例应该在明确之后成为GC的候选者。分析内存转储以查看正在发生的事情会很有趣。
安全/建议直接调用org.hibernate.Session #clear()
只要您flush()
挂起的更改没有松开它们(除非这是您想要的),我没有看到任何问题(您的当前代码将松散每100个循环创建但可能它只是一些伪代码)。
如果对上述问题的回答是正确的,那么对象foo会发生什么,假设在循环内调用clear()?如果foo.foo()是一个延迟加载方法怎么办?
答案 1 :(得分:1)
我只想指出,在清除会话后,如果要继续使用会话中的某些对象,则必须Session.refresh(obj)
才能继续。
否则您将收到以下错误:
org.hibernate.NonUniqueObjectException