有类似的问题,但我认为没有人问过这个问题。
情境:
客户 - 订单(订单具有客户ID) - 订单部分 - 部分
我想要一个查询,它返回一个客户及其所有订单和每个订单及其零件。
现在我有两个主要选择:
问题:
关于ORM的大多数建议和示例建议使用选项2,我可以看到原因。但是,选项2可能会发回大量重复数据,例如:
选项1结果(3个查询):
ID Name Country 1 Customer1 UK ID Name 1 Order1 2 Order2 ID Name 1 Part1 2 Part2 3 Part3
选项2结果(1个查询):
ID Name Country ID Name ID Name 1 Customer1 UK 1 Order1 1 Part1 1 Customer1 UK 1 Order1 2 Part2 1 Customer1 UK 1 Order1 3 Part3 1 Customer1 UK 2 Order2 1 Part1 1 Customer1 UK 2 Order2 2 Part2
选项1发回13个字段,包含3个查询。选项2在1个查询中发回42个字段。现在假设Customer表有30个字段,Orders有更复杂的子连接,数据复制很快就会变得庞大。
以下事项对整体表现有何影响:
选项2总是最佳选择,选项1是最佳选择还是取决于具体情况?如果取决于,您应该使用什么标准来确定?任何ORM都能够聪明地为自己解决这个问题吗?
答案 0 :(得分:7)
如果它们通常位于同一子网上,则很少。如果它们不是那么这仍然不是一个巨大的开销,并且可以通过缓存克服,大多数ORM都有(NHibernate具有一级和二级缓存)。
对于SELECT N+1
,这显然会更长,因为每次都必须发送select语句,这可能长达1k。它还必须从池中获取新连接。在2002-2003左右,Chatty与chunky的使用是一个争论,但现在它确实没有太大的区别,除非这是一个非常大的应用程序,在这种情况下你可能想要一个更有经验(或更好付费)的专家给出他的观点 - 即顾问。
我赞成加入,因为数据库将在10年或更长时间的开发中针对此用途进行优化。如果性能非常慢,View可以对此进行排序,或者存储过程。
顺便说一下,SELECT N+1
可能是人们在第一次开始使用NHibernate时遇到的最常见的性能问题(包括我),并且实际需要调整才能解决问题。这是因为NHibernate是ORMs C ++与语言的对比。
每个SELECT
的额外Customer
语句最终会累积到很多Customer
个对象* Orders
。因此对于大型系统而言,这可能是显而易见的 - 但正如我所提到的,ORM通常具有缓存机制来抵消这个问题。考虑到SELECT
语句的数量也不会那么大:
答案 1 :(得分:4)
这很大程度上取决于您正在经历的数据量。 返回更多字段时,连接的运行速度(通常)比选项1查询集快得多。 根据我的个人经验,减速几乎总是在那个级别,即查询的实际运行,而不是你所拥有的任何管道传递的大量数据。