每天运行的cron作业从表中获取数据并转储到仓库中。如果原始数据库中有错误,则会为任何ID更新一些字段。第二天,该作业再次运行,现在我们有一个ID的重复条目。我想要仓库中的最新更新。
item_id cost created updated
1 . 50 .20-01-19 20-01-19
1 . 70 .20-01-19 21-01-19
一个例子。对于相同的item_id,我显示两次费用。我只需要最新行。
该脚本在python上运行。除了将每个条目与仓库中已有的条目进行比较之外,我正在寻找有关从我的仓库中删除这些行的建议。