PostgreSQL中是否有哈希函数?

时间:2011-07-23 12:53:17

标签: postgresql sphinx

我正在使用Sphinx索引我的数据库。 问题是我必须通过字符变化字段过滤结果。 所以我必须找到一种方法将变化的字符转换为sql_attr_uint。 我知道mysql中的CRC32可以做到这一点。在PostgreSQL中是否有CRC32或任何替换?

2 个答案:

答案 0 :(得分:7)

这是定义思维sphinx(gem):

的CRC32函数
CREATE OR REPLACE FUNCTION crc32(word text)
RETURNS bigint AS $$
DECLARE tmp bigint;
DECLARE i int;
DECLARE j int;
DECLARE byte_length int;
DECLARE word_array bytea;
BEGIN
IF COALESCE(word, '') = '' THEN
return 0;
END IF;

i = 0;
tmp = 4294967295;
byte_length = bit_length(word) / 8;
word_array = decode(replace(word, E'\\\\', E'\\\\\\\\'), 'escape');
LOOP
tmp = (tmp # get_byte(word_array, i))::bigint;
i = i + 1;
j = 0;
LOOP
tmp = ((tmp >> 1) # (3988292384 * (tmp & 1)))::bigint;
j = j + 1;
IF j >= 8 THEN
EXIT;
END IF;
END LOOP;
IF i >= byte_length THEN
EXIT;
END IF;
END LOOP;
return (tmp # 4294967295);
END
$$ IMMUTABLE LANGUAGE plpgsql;

答案 1 :(得分:2)

也许你可以使用decode(substring(md5('foo') for 8), 'hex')。这将获得此字符串的md5哈希的前4个字节的bytea。

您可以使用以下内容将其转换为整数:

create function bytea_to_integer(bytea)
returns integer strict
language sql as $$
  select
     (get_byte($1,0)*1::integer<<0*8)
    +(get_byte($1,1)*1::integer<<1*8)
    +(get_byte($1,2)*1::integer<<2*8)
    +(get_byte($1,3)*1::integer<<3*8);
$$;