重复数据删除

时间:2018-12-03 07:54:31

标签: python machine-learning

我具有与所有商店相关的维度数据,我需要在记录中标识重复项(代表相同的商店)-数据不完整,并且缺少很多值-

我尝试过

  • 淘汰

  • 记录链接

感谢有关如何解决问题的帮助

TIA

S

1 个答案:

答案 0 :(得分:0)

使用MySql

CREATE PROCEDURE deduplicate()
BEGIN

    SELECT DISTINCT stores from storeDatabase ;  
END

关键字“ DISTINCT”将使它成为可能,以便返回的表仅在store列中具有唯一的观察结果。