数字VS Varchar(2)主键

时间:2008-11-27 16:31:28

标签: performance primary-key numbers varchar

我现在已经到了我的项目的这一点,我需要设计我的数据库(Oracle)。 通常对于status和countries表,我不使用数字主键,例如

STATUS (max 6)
AC --> Active
DE --> Deleted

COUNTRIES (total 30)
UK --> United Kingdom
IT --> Italy
GR --> Greece

这些表是静态的,不是通过应用程序更新的,并且预计将来不会进行更改,因此在使用这些值作为外键的表中不会出现更新问题。

该应用程序的主表将使用状态和国家/地区(不止一次,例如来自原籍国,目的地国家),预计每年将增加600000行

所以我的问题是,当查询3个表的连接时,这些VARCHAR(2)键是否会对性能产生影响。 第一个会明显慢于第二个吗?

SELECT m.*,
       s.status_name,
       c.country_name
  FROM main m, status s, countries c
 WHERE m.status_cd = s.status_cd
   AND m.country_cd = c.country_cd
   AND m.status_cd = 'AC'
   AND m.country_cd = 'UK'

SELECT m.*,
       s.status_name,
       c.country_name
  FROM main m, status s, countries c
 WHERE m.status_cd = s.status_cd
   AND m.country_cd = c.country_cd
   AND m.status_cd = 1
   AND m.country_cd = 2

澄清:

状态不是二进制(表名旁边的“最大6”)。值可能是:

* active
* deleted
* draft
* send
* replaced

我们需要向用户显示解码值,因此我们需要名称。

4 个答案:

答案 0 :(得分:5)

状态和国家/地区表都非常小,无论是否正式声明,它们都将成为实际的内存驻留者。实际上,除了外键通常需要在引用的主键字段上使用索引之外,您可能不想打扰表上的任何索引。

不同类型的连接之间的性能差异可以忽略不计,并且数字代码将会更慢,因为存储的“更多”数据(但它是如此之小以至于可以忽略不计, )。

所以,请使用自然代码。除此之外,第一个例子中的SQL更清晰; '英国'和'AC'比1和2更有意义。

在非Oracle DBMS中,您可能会对状态和国家/地区代码值使用CHAR(2)。 Oracle用户倾向于使用VARCHAR2来处理所有事情;我不确定使用CHAR(2)列是否会受到惩罚,特别是因为列值是固定长度。 (例如,在Informix下,VARCHAR(2)字段 - 最多两个字符的字段 - 将存储为3个字节,长度(在您的情况下总是2)和2个数据字节。相比之下,CHAR(2) )字段只占用2个字节。)

答案 1 :(得分:2)

查看此link。底线是varchar和num之间没有太大的性能差异。因此,您应该选择对该列有意义的内容。 varchar似乎更有意义。

答案 2 :(得分:0)

如果'status'是(并且将永远是?)二进制活动/删除字段,为什么还要打扰表。似乎规范化被带到了一个不切实际的极端。

如果只是使用tinyint(1)字段并将活动/删除状态记录为1或0,肯定更快,更不用说更容易了。

这完全消除了你的一个连接,这必须是一件好事。

答案 3 :(得分:0)

在这种情况下,您选择哪种方法无关紧要。重要的是在整个数据库中使用相同的类型,并在您的id约定中保持一致。