假设我的数据库给我一个查询结果,如下:
{'_id': ObjectId('5c99d76a32aacf180485c3b3'),
'text': 'ILLUSTRATION : 1\nFind the quotient and remainder q and r for the pairs of positive integers given below:\n(i) 23,4\n(ii) 81,3\n(iii) 12,5\nUTION.\n',
'text2': '',
'parent': None,
'repost': 3,
'time': datetime.datetime(2010, 5, 9, 16, 5, 27, 838000)}
我想获取前1000个文档,其中text
或text2
的长度> = 5:
我可以通过Python做到这一点,但这样做是愚蠢的:
objects = []
i = 0
for obj in db.essays.find():
if len(obj['text']>=5) or len(obj['text2']>=5):
objects.append(obj)
i+=1
if i==1000:
break
我知道这太愚蠢了。
如果完全匹配,我可以使用limit(1000)
,但是我不知道如何根据值的长度来获取文档。
编辑: 我设法以某种方式完成了 PATCH :
{ "$or":[{"$expr": { "$gt": [ { "$strLenCP": "$text" }, 5 ]}},
{"$expr": { "$gt": [ { "$strLenCP": "$text2" }, 5 ]}},
{"$expr": { "$gt": [ { "$strLenCP": "$text3" }, 5 ]}},
]}
但是当我使用AND
操作获取所有文本的长度都小于3的文档时,会引发错误:
{ "$and":[{"$expr": { "$lt": [ { "$strLenCP": "$text" }, 5 ]}},
{"$expr": { "$lt": [ { "$strLenCP": "$text2" }, 5 ]}},
{"$expr": { "$lt": [ { "$strLenCP": "$text3" }, 5 ]}},
]}
它可以与limit(2)
一起使用,但不能通过> 2并抛出错误,如下所示:
`OperationFailure: $strLenCP requires a string argument, found: null`
答案 0 :(得分:5)
您可以将管道与strLenCP
一起使用db.collection.aggregate([
{
"$match": {
"$expr": {
"$or": [
{
"$gte": [
{
"$strLenCP": {
"$ifNull": [
"$text",
""
]
}
},
5
]
},
{
"$gte": [
{
"$strLenCP": {
"$ifNull": [
"$text2",
""
]
}
},
5
]
}
]
}
}
},
{
"$limit": 1000
}
])
但是,如果您真的在意性能,那么最好的方法是预处理该信息:
{
'_id': ObjectId('5c99d76a32aacf180485c3b3'),
'text': 'ILLUSTRATION : 1\nFind the quotient and remainder q and r for the pairs of positive integers given below:\n(i) 23,4\n(ii) 81,3\n(iii) 12,5\nUTION.\n',
'text2': '',
'parent': None,
'repost': 3,
'time': datetime.datetime(2010, 5, 9, 16, 5, 27, 838000),
'text_len': 100,
"text2_len": 0
}
所以现在一个简单的查询就足够了:
db.essays.find({"$or": [{"text_len": {"$gte": 5}}, {"text2_len": {"$gte": 5}}]}).limit(1000)
答案 1 :(得分:1)
您可以使用$strLenCP
聚合管道。
这是示例代码示例:
objects = []
for obj in db.essays.aggregate([
{
"$project": {
"text1Len": {
"$strLenCP": "$text"
},
"text2Len": {
"$strLenCP": "$text2"
},
"docRoot": "$$ROOT",
}
},
{
"$match": {
"$or": [
{"text1Len": {"$gte": 5}},
{"text2Len": {"$gte": 5}},
]
}
},
{
"$limit": 1000
},
{
"$replaceRoot": {
"newRoot": "$docRoot"
}
},
]):
objects.append(obj)