我想随机抽样给定数量的文档,其中字段“日期”大于或等于“ 2020-01-01”。这是我的代码
from pymongo import MongoClient
client = MongoClient('connection sting')
db = client.myDataBase
pipeline = [{'$sample':{'size': numberOfDocument}, 'date':{'$gte':'2020:01:01'}}]
pd.DataFrame(list(db['collectionName'].aggregate(pipeline)))
最后一行给我以下错误
有人知道如何获得写入结果吗? OperationFailure:管道阶段规范对象必须仅包含一个字段。
答案 0 :(得分:1)
使用pymongo,您需要使用datetime对象。您需要导入日期时间。
请尝试:
date_match = datetime.datetime(2020, 1, 1)
pipline = [{'$match': {'date': {'$gte': date_match}}},
{'$sample': {'size': 2}}]