这似乎是如此基本,我因为缺乏一个更好的词而大吃一惊。我有两张桌子,我们称之为albums
和artists
CREATE TABLE `albums` (
`album_id` bigint(20) NOT NULL AUTO_INCREMENT,
`artist_id` bigint(20) DEFAULT NULL,
`name` varchar(200) NOT NULL,
PRIMARY KEY (`album_id`)
)
CREATE TABLE `artists` (
`artist_id` bigint(20) NOT NULL AUTO_INCREMENT,
`name` varchar(250) NOT NULL,
PRIMARY KEY (`artist_id`)
)
每个表中有几十万秒。一些专辑行的空artist_id
,这是预期的。
但是,当我执行以下查询以查找没有相册的艺术家时:
SELECT * FROM artists WHERE artist_id NOT IN (SELECT artist_id FROM albums)
...查询返回零结果。我知道这不是真的。所以我尝试了这个:
SELECT * FROM artists WHERE artist_id NOT IN (SELECT artist_id FROM albums WHERE artist_id IS NOT NULL)
......我回来了几千行。我的问题是:为什么第一个查询似乎操作任何数字= NULL的想法?或者这是NULL对IN()
语句的奇怪影响?我觉得这是我错过的基本内容。我根本不在我的数据库表中使用NULL。
答案 0 :(得分:7)
快速回答 - IN
语句是=a OR =b OR ...
的快捷方式。如果在此列表中包含空值,那么我认为这会破坏该语句。你的第二个选择可能是更好的选择。
或者使用联接也可能有效,并且效率更高。
答案 1 :(得分:7)
这就是NOT EXISTS
在语义上正确的原因
SELECT * FROM artists ar
WHERE NOT EXISTS
(SELECT * FROM albums al WHERE ar.artist_id = al.artist_id)
逻辑:
NOT IN (x, y, NULL)
NOT (x OR y OR NULL)
(NOT x) AND (NOT y) AND (NOT NULL)
因此NULL
使整个NOT IN
答案 2 :(得分:2)
它与SQL NULL的解释方式有关 - 你必须将它们视为UNKNOWN值。
假设你有artist_id = 1
如果您运行以下内容:
artist_id = NULL
而不是“假” - 你得到'未知';
当您运行诸如您的查询时,仅返回评估为“TRUE”的值。
artist_id IN (NULL, NULL, NULL...) = UNKNOWN
artist_id NOT IN (NULL, NULL, NULL....) = UNKNOWN