所以我有一个数据库表,许多其他表依赖于这个表,这意味着我需要尽早从中获取密钥。问题是,这意味着往返数据库,必要时在表格中创建一行并返回密钥,我想知道是否有任何聪明的方法可以消除这一步。
部分问题在于,真正唯一标识每一行的列具有可变长度并且可能非常长,使其不适合用作键。以此为例,假设我的所有数据都是基于“域”组织的,为简单起见,假设一个网站域。因此,我可能会有两个表如下所示:
CREATE TABLE `domains` (
`key` binary(16) NOT NULL DEFAULT X'0000000000000000',
`name` varchar(255) NOT NULL DEFAULT '',
PRIMARY KEY (`key`),
UNIQUE KEY `name` (`name`)
);
CREATE TABLE `users` (
`domain` binary(16) NOT NULL DEFAULT X'0000000000000000',
`username` varchar(64) NOT NULL DEFAULT '',
`email` varchar(255) DEFAULT '',
PRIMARY KEY (`domain`,`username`)
);
目前在此示例中处理域名时,我会执行以下操作:
INSERT IGNORE INTO `domains` (`key`, `name`)
VALUES (UUID_TO_BIN(UUID(), TRUE), a_name);
SELECT `key` FROM `domains` WHERE `name` = a_name;
这很好用,但你可以看到它涉及往返;在我的情况下,我立即触发INSERT
,而不是先SELECT
,检查结果,然后返回另一个传递。
我已经考虑过的一个替代方案是使用v5 UUID而不是v1;实质上生成name
列的SHA-1哈希并将其存储为密钥。这意味着密钥总是可以预测,只知道name
,因此不需要往返。实际上,如果我愿意,我甚至可以延迟或跳过INSERT
。
此选项的问题在于生成的UUID是高度随机的,这对于索引并不理想,因为这意味着即使一小部分域也可以在众多索引页面上广泛传播。在上面的示例中,索引性能是我使用推荐的使用UUID_TO_BIN(a_uuid, TRUE)
存储UUID的方法的原因,它重新排序v1 UUID以提高索引性能,因此用高度随机的密钥替换它似乎是一个糟糕的交易 - 关闭,特别是如果在我的数据库中广泛使用相同的基本密钥。
另一个明显的替代方法是尝试在我的应用程序中缓存域密钥,这样就不需要查找已知的域。
这个问题是我的应用程序是基于PHP的,这意味着我缓存此信息的主要方法是将其存储在一个文件中(烦人但可行)或用户的$_SESSION
数组。后者虽然最简单,但依赖于总是有可用的会话ID,这是无法保证的;也就是说 - 在最糟糕的情况下,没有请求包含一个请求,我每次都在进行全程往返。
我一直在敲打这个问题一段时间,因为没有一个选项完全突然出现在我的理想状态,我不禁动摇了一种可能有一个我不知道的聪明解决方案的感觉的。
所以我的问题是;什么是避免这种往返密钥检索的最简单方法?是否有我已经考虑过的替代方案或改进措施(例如,避免我发现的问题)?
解决这个问题的方法应该是完全取消往返,或者在大多数情况下不再需要它。
如果有必要,我可以尝试提供我实际系统的更多细节,但实际上上面的例子应该涵盖它;即,在我可以执行涉及users
表的任何事情之前,我需要确定需要查询的域密钥。
答案 0 :(得分:0)
此选项的问题在于生成的UUID是高度随机的,这不是索引的理想选择,因为这意味着即使是一小组域也可以在众多索引页面上广泛传播。指数表现就是为什么......
我认为这可能是过早优化的情况。为集合创建的索引将在相同页面中维护相邻的密钥,而不管它们之间缺少密钥的数量。不要试图想出数据库。即使你有稀疏密钥,它的优化也会对99%的情况都是正确的。
所以我有一个数据库表,许多其他表依赖于这个表,这意味着我需要尽早从中获取密钥。问题是,这意味着数据库的往返,如果需要在表格中创建一行并返回密钥,我想知道是否有任何聪明的方法来消除这一步。
大多数数据库都可以自动将顺序ID分配给列。对于MySQL
,该方法为AUTO_INCREMENT
列。将主表中的key
列设置为AUTO_INCREMENT
,并且不要在INSERT
上为该列提供值。然后,后续插入可以使用LAST_INSERT_ID()
为外键列提供值。它看起来像这样:
CREATE TABLE `domains` (
`key` INT NOT NULL AUTO_INCREMENT,
`name` varchar(255) NOT NULL DEFAULT '',
PRIMARY KEY (`key`),
UNIQUE KEY `name` (`name`)
);
CREATE TABLE `users` (
`domainid` INT NOT NULL DEFAULT 0,
`username` varchar(64) NOT NULL DEFAULT '',
`email` varchar(255) DEFAULT '',
PRIMARY KEY (`domain`,`username`)
);
INSERT INTO `domain` (`name`)
VALUES ('example.com');
INSERT INTO `users` (`domainid`,`username`,`email`)
VALUES (LAST_INSERT_ID(),'henryg','henryg@gmail.com');
无需额外访问服务器,服务器会跟踪最后插入的ID。