postgresql:md5消息摘要的数据类型?

时间:2013-04-13 00:12:45

标签: database postgresql database-design

我想使用某些字符串的MD5消息摘要作为表的主键。我应该为这样的字段使用什么数据类型?我应该为该字段撰写哪些selectinsert语句?

2 个答案:

答案 0 :(得分:10)

作为bytea的md5哈希将仅使用16个字节而不是32个用于hexa表示:

create table t (d bytea);
insert into t (d) values
    (digest('my_string', 'md5')),
    (decode(md5('my_string'), 'hex'));

上述两种表单都可以使用,但要使用更简单的digest函数,必须以超级用户身份安装pgcrypto扩展名:

create extension pgcrypto;

使用digest功能或上述decodemd5的组合搜索特定字符串:

select
    octet_length(d) ba_length,
    pg_column_size(d) ba_column,
    encode(d, 'hex') hex_representation,
    octet_length(encode(d, 'hex')) h_length,
    pg_column_size(encode(d, 'hex')) h_column
from t
where d = digest('my_string', 'md5')
;
 ba_length | ba_column |        hex_representation        | h_length | h_column 
-----------+-----------+----------------------------------+----------+----------
        16 |        17 | 3d212b21fad7bed63c1fb560c6a5c5d0 |       32 |       36
        16 |        17 | 3d212b21fad7bed63c1fb560c6a5c5d0 |       32 |       36

pg_column_size值是存储大小。与hexa表示相比,bytea小于一半。

答案 1 :(得分:1)

bytea有一个字节的开销,但填充到8个字节会导致严重的浪费。

相反,请考虑使用仅使用16个字节的uuid类型。 REPLACE(md5::text, '-', '') as md5,但这应该是一种快速操作。