我在RethinkDB表中有json记录。
[{
"pid": 12,
"sk": [
{
"sid": 30,
"et": 3
},
{
"sid": 22,
"et": 10
},
{
"sid": 30,
"et": 8
}
],
"wc": [
{
"wid": 7,
"et": 8
},
{
"wid": 3,
"et": 6
},
{
"wid": 9,
"et": 7
}
]
}]
就像这个一样,我在表中有数百万行。 我想要实现的是根据{sid,et}
的输入集过滤这个json在python中使用下面的代码(skObj是输入)::
skObj=[{'sid': 1, 'et': 9},{'sid': 27, 'et': 6}]
cursor2=r.table('cube7').filter(lambda row: r.expr(skObj).set_difference(row['sk']).is_empty())['pid'].run(t)
cur_list2 = list(cursor2)
Above查询根据sk的输入集正确过滤RethinkDB中的cube7表。 skObj最多可以包含10个。
我希望看到的是每个输入集
skObj=[{'sid': 22, 'et': 10},{'sid': 30, 'et': 8}]
我想用这个条件过滤表格:
(sid=22 & et>=10) and (sid=30 & et>=8)
但目前它只是像
那样做等于(sid=22 & et=10) and (sid=30 & et=8)
对于每组(sid,et)的et值,我如何使用大于lambda表达式的内部?
如何从下面创建通用表达式 - 这适用于原始数据
lambda x: (x['sid'] == 22) & (x['et'] >= 10)
答案 0 :(得分:2)
所以你想获得sk
数组包含至少一个与每个谓词匹配的文档的所有文档?
这样做你想要的吗?
r.table('cube7').filter(
lambda row: r.and_(r.args(r.expr(skObj).map(
lambda x: row['sk'].contains(
lambda y: (y['sid'] == x['sid']) & (y['et'] >= x['et'])
)
)))
)