php制作rss描述的唯一哈希

时间:2010-08-15 19:40:57

标签: php hash rss duplicates

我正在使用php创建一个sorta rss聚合器,它将来自多个站点rss feed的数据存储到mysql数据库中。由于文章可能在许多网站上重复,我想避免这种情况。香港专业教育学院被告知你可以使用散列基于rss [description + title]的内容制作独特的散列。现在哪种散列算法最快,产生的字符越少,我就可以用它来进行比较,以避免重复。

提前完成

3 个答案:

答案 0 :(得分:2)

sprintf('%u',crc32())产生4,294,967,296个组合,并且它比md5或sha1短。它只有32位宽。

答案 1 :(得分:1)

为避免错误重复,您应使用加密安全散列算法,如SHA-1或MD5。

答案 2 :(得分:1)

MD5最快,产生的字符长度为32个字符。

<?php
$hash = md5($description . $title);
?>

我在我的RSS解析器中使用它的目的完全相同。它就像一个魅力。