我有两个Google App Engine模型。我运行了几次我的cron,现在我的数据存储区中有重复的条目。如果很容易删除我的整个数据存储区并再次上传我的数据,我会的。但是上次上传需要4个小时,所以我想知道在模型的“标题”字段中是否有快速删除具有重复名称的条目的方法?
答案 0 :(得分:3)
快速?可能不是。
如果您确实想要删除dupes,我的方法是编写remote_api脚本。查询所有实体的模型,按标题排序,并获取100个批次。保留标题的本地Python字典。如果您遇到新标题,请将其添加到字典中。如果遇到已知标题,请将实体添加到删除批处理,并在继续执行下一个查询批处理之前刷新删除。
当您可以清除数据存储区并重新导入时,可能需要进行大量工作。