如何摆脱cloudantdb的重复项?

时间:2019-05-30 04:25:58

标签: ibm-cloud cloudant

我是非关系数据库的新手。 我花了数小时搜寻所有方法,以从我的包含Twitter数据的cloudant数据库中删除重复项。

例如,在以下屏幕截图中,文本字段中有重复项。是否可以使用Cloudant仪表板或任何其他方法删除它们?

enter image description here

谢谢...

1 个答案:

答案 0 :(得分:2)

Cloudant中没有像在关系数据库中那样方便的唯一性约束。唯一唯一的是文档ID。由于您可以自由提供自己的文档ID,因此可以将tweet正文字符串的(例如)md5哈希值设为。那样的话,如果您试图插入一个骗子就会产生冲突。

否则,您需要创建一个视图,该视图发出主体(或其哈希)作为键,并有一个单独的过程来检查此视图是否存在重复项,并根据需要将其删除,如此处接受的答案所述:< / p>

Identifying Duplicates in CouchDB