如何使用python-couchDB和map reduce从CouchDB中删除重复的文档?

时间:2017-04-28 08:22:17

标签: couchdb

我正在对存储在couchDB中的数据进行python编程处理,但数据库中的数据有一些重复。 例如,这些是表示推文的数据库中的两个文档:

{
  "_id": "0245d6a270ff7f2c9459544185adfc50",
  "_rev": "1-4a6ccb26cfde2da4b70188ba05d29c46",
  "twitter_id": "0d8e7f60615584747d869770b0033e55",
  "coordinates": null,
  "text": "Jimins playlist is sexy af"
}


{
  "_id": "0245d6a270ff7f2c9459544185ae03e5",
  "_rev": "1-4a6ccb26cfde2da4b70188ba05d29c46",
  "twitter_id": "0d8e7f60615584747d869770b0033e55",
  "coordinates": null,
  "text": "Jimins playlist is sexy af"
}

这些文件代表相同的推文,但数据库中有数千个文档。我可以使用map-reduce删除相同的推文吗?

我使用python作为编程语言。

0 个答案:

没有答案