我正在寻找一种有效的方法来获取Cloudant数据库中删除的文档列表。
背景:我有一个包含400万条记录的Cloudant数据库。业务逻辑还允许删除文档。此数据库中的数据每天加载到SQL数据仓库中,并且还需要标记为已删除。
完全重新加载是没有选择的,因为它需要太长时间。如果Cloudant数据库包含如此多的文档,那么查询_changes流似乎也不能很好地扩展。
答案 0 :(得分:0)
我会使用_changes
Feed并应用服务器端过滤器函数(http://guide.couchdb.org/draft/notifications.html)来删除所有未设置_deleted
属性的文档。因此,只有在报告DELETE操作并且网络流量保持最小时,才会通知您的更改订阅源侦听器。