这个问题适用于MySQL(它允许列中的许多NULL是唯一的,所以我的问题的解决方案可能会略有不同)。
有两个表:成员和表2。
表成员有:
memberid char(20),
这是主键。 (请不要建议对memberid使用int(11)而不是char(20),我不能更改它,它只包含20个符号)。
表2有:
CREATE TABLE IF NOT EXISTS `Table2`
`id` int(11) unsigned NOT NULL AUTO_INCREMENT,
memberid varchar(20) NOT NULL,
`Time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP,
status tinyint(4) NOT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB;
Table2.memberid是一个单词'guest'(可以重复多次)或来自members.memberid的值(它也可以重复多次)。 Table2.memberid列中的任何值(如果不是'guest')都存在于members.memberid列中。同样,members.memberid是唯一的。 Table2.memberid,即使不包括单词'guest'也不是唯一的。
因此,Table2.memberid列如下所示: '客人' 'lkjhasd3lkjhlkjg8sd9' 'kjhgbkhgboi7sauyg674' '客人' '客人' '客人' 'lkjhasd3lkjhlkjg8sd9'
表2仅有INSERTS和UPDATES。它仅更新状态。更新状态的标准:set status = 0 WHERE memberid =''和status = 1。因此,它可以更新一次或根本不更新。因此,UPDATES的数量小于或等于(通过统计数据,它比INSERTS的数量少两倍)。
问题仅在于优化。 这个问题可以分为:
1)您是否强烈建议将“guest”替换为NULL或更换为特殊的“xxxxxyyyyyzzzzz00000”(20个符号,如“非常特殊且保留”的字符串),以便您可以使用字符(20)对于Table2.memberid,因为所有值都是char(20)?
2)使用外键怎么样?由于'客人'的价值,我无法使用它。该值不能在members.memberid列中。
用另一个词,我需要一些帮助来决定:
我可以使用'guest'(我喜欢那个词) -vs - 选择20-char-reserved-string所以我可以使用char(20)而不是varchar(20) ) -vs - 保留NULL而不是'guest',
除'guest'之外的所有值实际上都是外键。有没有可能的方法来使用这些信息来提高性能?
经常使用该表,所以我必须尽可能地构建Table2。任何想法都受到高度赞赏。
谢谢。
添加了: 好吧......我想我找到了一个很好的解决方案,它允许我将memberid视为外键。
答案 0 :(得分:1)
1)您是否强烈建议将“guest”替换为NULL或a 特别'xxxxxyyyyyzzzzz00000'(20个符号,如'非常特别和 保留'字符串'所以你可以为Table2.memberid使用chars(20), 因为所有值都是char(20)?
混合来自不同域的值总是会带来麻烦。最好的办法是解决潜在的结构问题。糟糕的设计可能会非常昂贵,而且修复起来确实很昂贵。
简而言之,这就是问题所在。对于此类问题,最简单的数据完整性约束是外键约束。你不能使用一个,因为“客人”不是会员。 (成员ID来自一个域;“来宾”不是该域的一部分;您正在混合来自两个域的值。)使用NULL来识别来宾并没有多大帮助;你不能将客人与其memberid缺失的成员区分开来。 (使用NULL来识别任何东西通常都是个坏主意。)
如果您可以使用特殊的20个字符的成员ID来识别所有来宾,那么这样做可能是明智之举。你可能很幸运,因为“客人”是五个字母。如果您可以在不完全搞砸应用程序逻辑的情况下为客户使用“guestguestguestguest”,我会首先考虑这一点。 (但是,你说这似乎把客人视为登录用户,我认为这会使事情破裂。)
我认为,改进“用户”超类型是可能的,这可能是最好的整体解决方案。超类型会让你有时对待会员和客人(因为它们并没有完全不同),而在其他时候则不同(因为它们并不完全相同)。超类型也允许个人(成员)和聚合用户(客人都集中在一起)而没有过度紧张。它会统一这两个域,因此您可以对成员使用外键约束。但它需要改变程序逻辑。
在Table2中(并且 do 找到一个比这更好的名称,请),memberid上的索引或memberid和status上的复合索引将执行与您期望的一样好的操作。我不确定综合指数是否会有所帮助; “status”只有两个值,所以它不是很有选择性。
除'guest'之外的所有值实际上都是外键。有没有 可能的方法来使用这些信息来提高性能?
不,他们不是外键。 (见上文。)真正的外键有助于数据完整性,但不具备SELECT性能。
“提高性能”几乎毫无意义。绩效是一种平衡行为。如果要提高性能,则需要指定要改进的部分。如果您想要更快的插入,删除索引和完整性约束。 (不要这样做。)如果您想要更快的SELECT语句,请构建更多索引。 (但是更多的索引会减慢INSERTS。)
通过转移到可加快所有数据库性能的硬件,您可以加快所有数据库性能。 (哼)更快的处理器,更快的磁盘,更快的磁盘子系统,更多的内存(通常)。将关键表或索引移动到固态磁盘可能会让您失望。
调整服务器可以提供帮助。但要注意整体表现。加速查询速度不会比降低所有其他查询的性能。理想情况下,编写测试套件并在开始测试之前确定足够好的速度。例如,假设您有一个需要30秒的查询。什么是可以接受的改进? 20秒? 15秒? 2毫秒听起来不错,但对于需要30秒的查询来说,这不太可能。 (虽然我通过转向更好的表和索引结构看到了这种性能提升。)