加载Java实体时内存不足

时间:2010-06-02 21:45:03

标签: java jpa java-ee ejb-3.0

我有一个可怕的问题,希望有一个非常简单的答案。当我执行基本的

时,我的内存不足

如果我有这样的代码:

MyEntity myEntity;
for (Object id: someIdList) {
   myEntity = find(id); 
   // do something basic with myEntity
}

find()方法是与标准的EntityManager相关的方法:

public MyEntity find(Object id) {
    return em.find(mycorp.ejb.entity.MyEntity.class, id);
}

这段代码几周前就已经运行了,如果数据库中的项目较少,则可以正常工作。我面临的结果是:

java.lang.OutOfMemoryError:超出GC开销限制

异常来自oracle toplink调用一些oracle jdbc方法。

循环存在是因为EJBQL(例如“将MyEntity中的选择对象(o)作为o”)会在有大量记录时使应用程序服务器过载。

2 个答案:

答案 0 :(得分:9)

  

这段代码几周前就已经运行了,如果数据库中的项目较少,则可以正常工作。我面临的结果是:java.lang.OutOfMemoryError: GC overhead limit exceeded

这里没有什么令人惊讶的。由em.find()加载的实体被放置并保存在持久化上下文中(在内存中)以跟踪更改,因此如果您在没有预防措施的情况下批量加载过多的实体,则只会爆炸内存并获取OOME。

如果您确实需要对所有实体执行某些操作,需要首先调用flush() 以将所有更改推送到数据库,然后然后{{1} } 清除持久化上下文并定期释放内存:

clear()

调用int i = 0; for (Object id: someReallyBigIdList) { myEntity = find(id); // do something basic with myEntity if ( i % 20 == 0 ) { //20, same as the JDBC batch size //flush a batch of DML operations and release memory: em.flush(); em.clear(); } i++; } 会导致所有托管实体分离。对未刷新到数据库的实体所做的更改将不会保留因此首先需要clear()更改

答案 1 :(得分:4)

问题是,如果你执行循环,你只需查询一个接一个的实体,但它仍然在你的EntityManager中被引用。你必须

  • clear()entityManager,或
  • 从中删除实体(忘记调用该函数的方式)。

如果可能的话,最好只设置实体管理器,因为这会阻止JPA在内存中保存每个对象的副本,只是为了检测在flush()的情况下是否有可能的更改数据库。