MySQL 5.5.24 - UPDATE上的重复条目,当没有真正重复时

时间:2012-11-22 19:14:20

标签: mysql sql-update duplicates

我必须使用以下结构更新表:

CREATE TABLE `eav_entity_attribute` (
  `entity_attribute_id` int(10) unsigned NOT NULL AUTO_INCREMENT COMMENT 'Entity Attribute Id',
  `entity_type_id` smallint(5) unsigned NOT NULL DEFAULT '0' COMMENT 'Entity Type Id',
  `attribute_set_id` smallint(5) unsigned NOT NULL DEFAULT '0' COMMENT 'Attribute Set Id',
  `attribute_group_id` smallint(5) unsigned NOT NULL DEFAULT '0' COMMENT 'Attribute Group Id',
  `attribute_id` smallint(5) unsigned NOT NULL DEFAULT '0' COMMENT 'Attribute Id',
  `sort_order` smallint(6) NOT NULL DEFAULT '0' COMMENT 'Sort Order',
  PRIMARY KEY (`entity_attribute_id`),
  UNIQUE KEY `UNQ_EAV_ENTITY_ATTRIBUTE_ATTRIBUTE_SET_ID_ATTRIBUTE_ID` (`attribute_set_id`,`attribute_id`),
  UNIQUE KEY `UNQ_EAV_ENTITY_ATTRIBUTE_ATTRIBUTE_GROUP_ID_ATTRIBUTE_ID` (`attribute_group_id`,`attribute_id`),
  KEY `IDX_EAV_ENTITY_ATTRIBUTE_ATTRIBUTE_SET_ID_SORT_ORDER` (`attribute_set_id`,`sort_order`),
  KEY `IDX_EAV_ENTITY_ATTRIBUTE_ATTRIBUTE_ID` (`attribute_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='Eav Entity Attributes'

上表包含一行:

INSERT INTO `eav_entity_attribute`
(`entity_attribute_id`, `entity_type_id`, `attribute_set_id`, `attribute_group_id`, `attribute_id`, `sort_order`)
VALUES
(32758, 4, 224, 3423, 5171, 12)

我正在运行一个自动导入程序,它将读取外部数据源并写入此表。

此导入多次运行,因此有时会多次导入相同的数据。在这种情况下,该过程只是用新的数据覆盖旧数据,即使新数据与旧数据相同。存在相同数据的条件使用ON DUPLICATE KEY UPDATE子句处理。这个工作几乎完美,除了这个特定的表。

在此表上,当过程尝试UPDATE时,我收到“Duplicate key”消息,我无法解释。我调试了代码,这是失败的查询(从INSERT..ON DUPLICATE KEY中提取):

UPDATE eav_entity_attribute
SET 
  `attribute_group_id` = 3423
  ,`attribute_id` = 5171
  ,`attribute_set_id` = 223
  ,`entity_type_id` = 4
  ,`sort_order` = 320
WHERE 
  (`attribute_group_id` = 3423) AND
  (`attribute_id` = 5171)

错误如下:

Error Code: 1062. Duplicate entry '3423-5171' for key 'UNQ_EAV_ENTITY_ATTRIBUTE_ATTRIBUTE_GROUP_ID_ATTRIBUTE_ID'

我知道对3423-5171已经存在,但UPDATE会自己替换这些值,而不是创建一个新条目。我对这个问题的原因感到很困惑,任何建议都会非常受欢迎。感谢。

更新 - 新发现

我得到了某种“灵感”,我做了一个实验。我删除了涉及attribute_set_idattribute_id的唯一约束(注意,这不是错误中的那个),我运行了INSERT..ON DUPLICATE查询。它运作得很好。

Mine是一个猜想,但这就是我的想法:我试图写入表中的数据与两个约束发生冲突:

  • UNIQUE(attribute_set_idattribute_id
  • UNIQUE(attribute_group_idattribute_id

INSERT失败,可能是因为第一个约束引起的重复错误。这会触发UPDATE,它使用第一个约束作为隐式WHERE子句。我的推测是,在这种情况下,第一个约束以某种方式被忽略,但是UPDATE跳过第二个约束,之前没有涉及。

对我而言,这似乎仍然不是UPDATE的有效原因,它可以替换自身以引发重复的输入错误,但它可能会对其背后的逻辑有所启发。

第二次更新

我发现我正在测试的表实际上包含很多行(我忘了禁用过滤后的视图),这是因为成功导入了其他数据。但是,“复制候选人”在集合中仍然是唯一的。

我确认评论中发布的内容,当表只包含那些行时,INSERT..ON DUPLICATE可以正常工作,以及单独更新UPDATE。现在我想知道为什么当表中有更多数据时表格搞砸了,因为我们仍在讨论使用相同数据更新的单个唯一行。

第三次更新 - 找到根本原因

我终于找到了UPDATE失败的原因,现在我必须找出如何处理这种情况。

线索是我在第一次更新时的推测。简单地说,我有两个非常相似的行(请注意我从干净的数据库开始使用不同的值)。

row,entity_attribute_id,entity_type_id,attribute_set_id,attribute_group_id,attribute_id,sort_order
1,16919, 4, 120, 1746, 80, 1
2,16649, 4, 119, 1744, 80, 210

以下是发生的事情:

  • INSERT尝试插入具有以下值的行:120, 4, 1744, 80, 54
  • 这会触发“重复键”,因为值120, 80与字段attribute_set_id, attribute_id(第1行)重复。
  • 然后MySQL尝试UPDATE,如下所示:

    更新表 entity_type_id = 4 ,attribute_group_id = 1744 ,sort_order = 54 哪里   (attribute_set_id = 120)AND(attribute_id = 80)

  • 这一次,UPDATE失败,因为值1744,80违反了第2行中找到的attribute_group_id, attribute_id对约束。

总结

  • INSERT失败,因为第1行具有与键attribute_set_id, attribute_id相同的值。
  • UPDATE失败,因为第2行具有相同的键attribute_group_id, attribute_id值。

解决方案

我将不得不审查整个进口程序,因为理论上不应出现这样的重复。 MySQL正在完成它的工作,它是复杂的数据库。

感谢所有建议。

1 个答案:

答案 0 :(得分:2)

尽量不要更新UPDATE的{​​{1}}子句中的键值。如果已经存在具有这些键值的记录,则要求MySQL更改键值是很奇怪的,因此,MySQL的意外行为并不令人惊讶。