使用php从mysql中删除重复项

时间:2011-06-23 19:16:22

标签: php mysql sql

这保留了两个表:“wp_extra_data”和“wp_posts”。 wp_extra_data具有字段“id”,“post_id”和“post_title_md5”。现在我需要弄清楚如何从“post_title_md5”中检索重复项,然后*从wp_posts中删除id = wp_extra_data-> post_id,除了最旧的post_id(也就是ID最低的那个*

实施例: wp_extra_data可能包含:

ID post_id post_title_md5
23 45      322a85c7502dfb2fce5bbd6794c00f81
56 92      322a85c7502dfb2fce5bbd6794c00f81
75 12      322a85c7502dfb2fce5bbd6794c00f81

在这种情况下,我希望脚本“从id = 92和12的wp_posts中删除”。所以总之;如何有效地从wp_extra_data中检索重复项,然后删除所有这些副本,除了具有最低键(ID)的副本。值得注意的是,我不知道“post_title_md5”会是什么样的。

2 个答案:

答案 0 :(得分:2)

mysql_query("Delete from wp_posts where ID not in
(select post_id from wp_extra_data where id in(select min(ID)
from wp_extra_data
group by post_title_md5))")

答案 1 :(得分:1)

检索重复的哈希很容易:

SELECT post_title_md5
FROM wp_extra_data
GROUP BY post_title_md5
HAVING COUNT(post_title_md5) > 1

然后你可以使用上面作为子查询的一部分来检索post_id:

SELECT post_id
FROM wp_extra_data
WHERE (post_title_md5 IN (... previous query here ...));

但是,这将使用重复的哈希检索所有ID。因此,您必须在此PHP端进行一些过滤,并在删除“第一个”后仅删除剩余的ID。