Rethinkdb mapreduce not has_fields无法正常工作

时间:2015-08-07 13:04:44

标签: mapreduce rethinkdb rethinkdb-python

我试图找到没有电话号码的记录百分比(按公司分组)。我可以通过以下两个查询来执行此操作:

r.table('users') \
 .merge(lambda u: {'groups': r.table('groups').get_all(r.args(u['group_ids'])).coerce_to('array')}) \
 .filter(lambda u: u.has_fields('phone')) \
 .group(lambda u: u['groups'][0]['company']).count().run()

并获取所有记录的计数:

r.table('users') \
 .merge(lambda u: {'groups': r.table('groups').get_all(r.args(u['group_ids'])).coerce_to('array')}) \
 .group(lambda u: u['groups'][0]['company']).count().run()

但是,我想使用map-reduce在单个查询中执行此操作,并且可能更高效。这是我的查询,但它不起作用,因为两个数字(电话和计数)是相同的:

r.table('users') \
 .merge(lambda u: {'groups': r.table('groups').get_all(r.args(u['group_ids'])).coerce_to('array')}) \
 .group(lambda u: u['groups'][0]['company']) \
 .map(lambda u: { 'phone': 1 if u.has_fields('phone') else 0, 'count': 1 }) \
 .reduce(lambda a, b: {'phone': a['phone'] + b['phone'], 'count': a['count'] + b['count'] }).run()

所以我的问题是,为什么has_fields() map命令工作filter<input type="text" />命令呢?

1 个答案:

答案 0 :(得分:1)

问题在于您使用的是Python if/then/else运算符。 Python没有公开与这些交互的方式,因此驱动程序无法看到整个if/then/else语句。如果您使用r.branch代替(r.branch(u.has_fields('phone'), 1, 0)),它应该有用。