Mongodb / python计算包含不同值的不同行

时间:2018-07-20 13:01:51

标签: python mongodb distinct

这是我的问题:

我有一个具有+1百万个条目的mongodb数据库,我必须计算不同的条目。

每个条目的doc_id由通讯号和文档号组成,下面是一个示例:EGNG9876543219876543219-000.pdf

由4个大写字母和19个数字组成的部分是通信号码。

问题是,对于每个通讯号码,都有多个文档(“ -000.pdf部分”。)

我尝试过这种方式:

docIds=list(collection.find({}, {"doc_id" : 1,"_id":0}))
comIds=[]
for i in range (docIds.count("doc_id")):
    comIds.append(docIds[i][:-8])
print(len(set(comIds)))

我想知道mongodb中是否有一种方法可以计算有多少个不同的通讯号码。

0 个答案:

没有答案