这是我的问题:
我有一个具有+1百万个条目的mongodb数据库,我必须计算不同的条目。
每个条目的doc_id由通讯号和文档号组成,下面是一个示例:EGNG9876543219876543219-000.pdf
由4个大写字母和19个数字组成的部分是通信号码。
问题是,对于每个通讯号码,都有多个文档(“ -000.pdf部分”。)
我尝试过这种方式:
docIds=list(collection.find({}, {"doc_id" : 1,"_id":0}))
comIds=[]
for i in range (docIds.count("doc_id")):
comIds.append(docIds[i][:-8])
print(len(set(comIds)))
我想知道mongodb中是否有一种方法可以计算有多少个不同的通讯号码。