为什么MySql LEFT OUTER JOIN返回20多行?

时间:2017-09-17 05:00:21

标签: mysql sql left-join

好的,我在以下LEFT OUTER JOIN查询中返回了400,816行

SELECT 
    `inventory`.`inventory_id`,
    `inventory`.`inventory_units_in_stock`,
    `inventory`.`sire_name`,
    `inventory`.`owner_id`,
    `inventory`.`facility`,
    `inventory`.`breed`,
    `inventory`.`cane_number`,
    `inventory`.`collection_date`,
    `inventory`.`inventory_temporary_location`,
    `inventory`.`inventory_tank`,
    `inventory`.`inventory_bay`,
    `inventory`.`inventory_canister`,
    `inventory`.`inventory_remarks`,
    `inventory`.`inventory_update`,
    `inventory`.`inventory_create`,
    `inventory`.`inventory_user_update`,
    `inventory`.`inventory_user_create`,
    `collections`.`collectionId`
FROM `inventory`
LEFT JOIN
    `collections` ON Date(`collections`.`collection_date`) = Date(`inventory`.`collection_date`)

库存表有20,867条记录,集合表有15,326条记录。那么上面的查询如何返回400,816条记录呢?

清单和集合表中的

collection_date是MySql数据类型= DATE。我在ON期间将它们包装在Date()中,因为没有它我得到相同的查询结果,我希望它是由于无效的日期比较。

我的目标是将数据移动到新数据库。我没有创建旧的,但原始数据库设计者配置了他们的查询来检查这两个表之间的日期。是的,库存表中可能有多个记录具有相同的收集日期,但库存是库存的实际库存。

这是集合表中的数据样本,collection_date是2045-04-16(不要问,不是我的数据)......

2152   271   AN   3137   2045-04-16    6972   172   XX   ok+   50   3   45   2015-04-20 08:14:02   2015-04-20 03:14:01   NULL   jenna
 701   237   AN   2996   2017-07-21   18996    25   IO   ISR    0   0    0   2017-07-21 10:51:48   2017-07-21 05:51:47   NULL   michael
5633   271   AN   3817   2017-07-20   19004    47   R    ok    50   3    8   2017-07-21 11:11:52   2017-07-21 06:11:52   NULL   Megan
5634   271   AN   3818   2017-07-20   19002    52   M    ok    45   3    8   2017-07-21 11:05:06   2017-07-21 06:05:06   NULL   Megan

以下是库存表中的数据样本,1901-04-29是库存收集日期。再次不要问日期,而不是我的数据我只是想把它移到新系统。

32711   159   5L Blazin View 1635-235x   10874   154   AR    207   1901-04-29   13   1    2   2014-02-10 16:04:59   2014-02-10 04:04:59   NULL, 
32712   114   5L Blazin View 1635-235x   10874   154   AR    207   1901-04-30   13   1   20   2014-02-10 16:04:59   2014-02-10 04:04:59   NULL, 
32713   121   5L Blazin View 1635-235x   10874   154   AR    207   1901-05-01   13   1   25   2014-02-10 16:04:59   2014-02-10 04:04:59   NULL, 
32714   130   5L Destination 893-6215    10874    99   AR   5602   1902-01-27    8   1   26   2016-04-21 06:24:31   2014-02-10 04:04:59   karla   
32715    45   5L Hobo Design 273-7047    10874    99   AR   6248   1900-07-31    5   1   34   2014-02-10 16:04:59   2014-02-10 04:04:59   NULL, 
32716    50   5L Hobo Design 273-7047    10874    99   AR   6248   1902-01-28    6   4   14   2014-02-10 16:04:59   2014-02-10 04:04:59   NULL, 
32717     1   5L Norse Design 673-5035   10874    75   AR    342   1900-05-31    7   1    2   2014-02-10 16:04:59   2014-02-10 04:04:59   NULL, 

如何停止指数返回结果的任何见解。我理解左外连接可以返回比左表中更多的行,但是我不知道这种类型连接可以返回比在表中最大数量的记录中找到的记录多20倍的记录。这些结果大大超过了两个表中的总行数,大约为36k。

预期的结果是简单地将新的collections.collectionId加入到库存表中,这样我就可以删除当前系统中的日期关系。我希望通过关联的collectionId返回20,867个库存记录。

1 个答案:

答案 0 :(得分:2)

如果你只使用提交的日期加入你的表,如果tableA中有5条记录,日期为X,而表格B中有20条记录,日期为X.查询结果为5 x 20 = 100

使用date()函数返回日期或日期时间表达式的日期部分。

我试着用一个例子来解释:

table_A
--------
nameA, date
a1, 2017-11-01
a2, 2017-11-01

table_B
-------
nameB, date
b1, 2017-11-01
b2, 2017-11-01

如果您使用查询中使用的类似联接加入A上的A:

  

从日期(table_A)=中的table_A左连接table_B中选择nameA,nameB   日期(表-B)

you will have:
a1, b1 -> Date(2017-11-01) is equal to Date(2017-11-01)
a1, b2 -> Date(2017-11-01) is equal to Date(2017-11-01)
a2, b1 -> Date(2017-11-01) is equal to Date(2017-11-01)
a2, b2 -> Date(2017-11-01) is equal to Date(2017-11-01)

请记住,在联接中使用Date()公式,您的数据库引擎不得使用索引。然后,这是查询数据的一种非常糟糕和缓慢的方式。