我有一个场景,我的应用程序可以访问有限时间窗口的会话,在此期间它必须将数据从数据库提取到内存中,然后只使用内存中的数据来处理请求。
数据模型是一个简单的一对多关联,例如:
<class name="com.foo.Road" table="road">
<id name="oid" column="oid"/>
<map name="carCountMap" fetch="subselect">
<key column="road_oid" foreign-key="oid"/>
<index column="time_oid" type="long" />
<one-to-many class="com.foo.CarCount" />
</map>
<map name="truckCountMap" fetch="subselect">
<key column="road_oid" foreign-key="oid"/>
<index column="time_oid" type="long" />
<one-to-many class="com.foo.TruckCount" />
</map>
</class>
现在假设汽车和卡车计数数据存在了好几年,这远远超过了内存。此外,我真的只对过去3个月的车载数量感兴趣。
我的问题是,使用hibernate加载这些数据的最佳方法是:
LazyInitializationException
被抛出我尝试过的一些事情是:
1。让carCountMap
集合渴望并在映射中指定where
属性,例如:
<map name="carCountMap" fetch="subselect" lazy="false" where="time_oid > 1000">
(类似于truckCountMap
)
这最符合我想要的集合语义,但不幸的是它迫使我硬编码一个值,所以我不能真正参考过去3个月。 time_oid
每天增加1。
2. 将地图定义为lazy并使用hql查询手动加入3个表:
from Road r
left outer join fetch r.carCountMap ccm
left outer join fetch r.truckCoutnMap tcm
where (ccm.time.oid > :startDate)
or (tcm.time.oid > :startDate)
问题在于结果查询返回数百万行,而应该是10k道路*每月4次测量(每周)* 3个月= ~120k。这个查询在大约一个小时内完成,这很荒谬,因为方法#1(在我关注的情况下加载完全相同的数据)在3分钟内完成。
3. 将地图定义为懒惰并首先使用条件加载道路,然后运行其他查询以填充集合
List roadList = session.createCriteria(Road.class).list();
session.getNamedQuery("fetchCcm").setLong("startDate", startDate).list();
session.getNamedQuery("fetchTcm").setLong("startDate", startDate).list();
return roadList;
这会触发正确的查询,但检索到的汽车和卡车计数不会附加到Road
中的roadList
个对象。因此,当我尝试访问任何Road对象的计数时,我得到LazyInitializationException
。
4. 将地图定义为懒惰,使用criteria.list()
加载所有道路,迭代过去3个月内的所有测量日期,以强制加载这些值。
我还没有尝试过,因为它听起来很笨重,而且我不相信它会摆脱LazyInitializationException
答案 0 :(得分:3)
在挖掘了更多之后,看起来hibernate filters是我需要的确切解决方案。
它们基本上提供了一个构造,在集合或类上具有where
属性,并在运行时绑定参数。
在映射文件中,定义过滤器并将其附加到集合:
<class name="com.foo.Road" table="road">
<id name="oid" column="oid"/>
<map name="carCountMap" fetch="subselect">
<key column="road_oid" foreign-key="oid"/>
<index column="time_oid" type="long" />
<one-to-many class="com.foo.CarCount" />
<filter name="byStartDate" condition="time_oid > :startDate" />
</map>
<map name="truckCountMap" fetch="subselect">
<key column="road_oid" foreign-key="oid"/>
<index column="time_oid" type="long" />
<one-to-many class="com.foo.TruckCount" />
<filter name="byStartDate" condition="time_oid > :startDate" />
</map>
</class>
<filter-def name="byStartDate">
<filter-param name="startDate" type="long"/>
</filter-def>
然后在dao中,启用过滤器,绑定参数并运行查询:
session.enableFilter("byStartDate").setParameter("startDate", calculatedStartDateOid);
return session.createCriteria(Road.class).list();
答案 1 :(得分:1)
我认为你的问题实际上由两部分组成:
关于第一部分,我认为当您尝试将数据子集加载到Road
字段时,您正在滥用域模型。
或许最好在Road
s和流量测量之间建立单向关系,即从Road
类中删除这些地图。它看起来很合理,因为您可能不会立即需要所有这些数据。然后,您可以创建一个由RoadStatistics
和这些流量图组成的DTO(未映射!)Road
,并使用您想要的任何数据填充它。
问题的第二部分是什么,我认为您需要使用纯SQL进行一些实验以优化查询,然后将最佳查询转换为HQL或Criteria。如果您的域模型不限制加载数据的方式,则可以轻松完成此转换(请参阅第一部分)。也许您需要通过创建一些索引等来优化数据库模式。