我正在使用php创建一个sorta rss聚合器,它将来自多个站点rss feed的数据存储到mysql数据库中。由于文章可能在许多网站上重复,我想避免这种情况。香港专业教育学院被告知你可以使用散列基于rss [description + title]的内容制作独特的散列。现在哪种散列算法最快,产生的字符越少,我就可以用它来进行比较,以避免重复。
提前完成
答案 0 :(得分:2)
sprintf('%u',crc32())产生4,294,967,296个组合,并且它比md5或sha1短。它只有32位宽。
答案 1 :(得分:1)
为避免错误重复,您应使用加密安全散列算法,如SHA-1或MD5。
答案 2 :(得分:1)
MD5最快,产生的字符长度为32个字符。
<?php
$hash = md5($description . $title);
?>
我在我的RSS解析器中使用它的目的完全相同。它就像一个魅力。