rethinkdb聚合基于序列项

时间:2015-05-13 10:01:51

标签: rethinkdb rethinkdb-python

我目前正在浏览rethinkdb python tutorial

目前,我有4个超级英雄。在下面的示例中,heroesr.db("python_tutorial").table("heroes")的别名。

In[45]: list(heroes.run())
Out[44]: 
[{u'appearances_count': 98,
  u'hero': u'Wolverine',
  u'id': u'28b6a53f-14c6-4a36-bb0b-45a6fb9c77c9',
  u'magazine_titles': [u'Amazing Spider-Man vs. Wolverine',
   u'Avengers',
   u'X-MEN Unlimited',
   u'Magneto War',
   u'Prime'],
  u'name': u"James 'Logan' Howlett"},
 {u'aka': [u'Magnus', u'Erik Lehnsherr', u'Lehnsherr'],
  u'appearances_count': 42,
  u'hero': u'Magneto',
  u'id': u'19274b39-f829-4daa-ba2b-24fd680e01c6',
  u'magazine_titles': [u'Alpha Flight', u'Avengers', u'Avengers West Coast'],
  u'name': u'Max Eisenhardt'},
 {u'appearances_count': 72,
  u'hero': u'Storm',
  u'id': u'69848f10-2f5a-48f4-8d87-c310b88f9487',
  u'magazine_titles': [u'Amazing Spider-Man vs. Wolverine',
   u'Excalibur',
   u'Fantastic Four',
   u'Iron Fist'],
  u'name': u'Ororo Monroe'},
 {u'appearances_count': 72,
  u'hero': u'Professor Xavier',
  u'id': u'22dd3ab1-60d6-4679-9c39-2ad7da6e48d0',
  u'magazine_titles': [u'Alpha Flight', u'Avengers', u'Bishop', u'Defenders'],
  u'name': u'Charles Francis Xavier'}]

喜欢要做的是根据他们所在的杂志标题对英雄进行分组。所以,我试图构建一个查询,这将提供如下内容:

u'Prime'
{    u'name': u"James 'Logan' Howlett"}
u'Fantastic Four'
{    u'name': u'Ororo Monroe'}
u'Excalibur'
{    u'name': u'Ororo Monroe'}
u'Defenders'
{    u'name': u'Charles Francis Xavier'}
u'Magneto War'
{    u'name': u"James 'Logan' Howlett"}
u'Bishop'
{    u'name': u'Charles Francis Xavier'}
u'Avengers West Coast'
{    u'name': u'Max Eisenhardt'}
u'Amazing Spider-Man vs. Wolverine'
{    u'name': u"James 'Logan' Howlett"}
{    u'name': u'Ororo Monroe'}
u'X-MEN Unlimited'
{    u'name': u"James 'Logan' Howlett"}
u'Alpha Flight'
{    u'name': u'Charles Francis Xavier'}
{    u'name': u'Max Eisenhardt'}
u'Avengers'
{    u'name': u"James 'Logan' Howlett"}
{    u'name': u'Charles Francis Xavier'}
{    u'name': u'Max Eisenhardt'}
u'Iron Fist'
{    u'name': u'Ororo Monroe'}

我已经设法通过两个单独查询来完成此操作。这基本上就是我做的:

In[46]: titles = list(heroes.concat_map(lambda hero: hero["magazine_titles"]).distinct().run())
In[47]: titles
Out[46]: 
[u'Alpha Flight',
 u'Amazing Spider-Man vs. Wolverine',
 u'Avengers',
 u'Avengers West Coast',
 u'Bishop',
 u'Defenders',
 u'Excalibur',
 u'Fantastic Four',
 u'Iron Fist',
 u'Magneto War',
 u'Prime',
 u'X-MEN Unlimited']

上面给出了所有标题的列表。然后,我只搜索数据库以查看标题是否在英雄的magazine_titles中。像这样:

In[48]: from collections import defaultdict
In[49]: title_data = defaultdict(list)
In[57]: for title in titles:
...         title_data[title] = list(heroes.filter(lambda hero: hero["magazine_titles"].contains(title)).pluck("name").run())
In[59]: for title, heroes in title_data.items():
...     pprint(title)
...     pprint(heroes, indent=4)

但是,我想在一个查询中执行此操作。对于所述查询,它会比像我这样做两个单独的查询更有效吗?

1 个答案:

答案 0 :(得分:2)

multi heroes.group('magazine_titles', multi=True)['name'] 命令可以执行您想要的操作:

val1 = CStr(ThisWorkbook.Worksheets("test").Cells(i + 38, 1).Value)
val2 = CStr(ThisWorkbook.Worksheets("test").Cells(i + 38, 2).Value)
val3 = CStr(ThisWorkbook.Worksheets("test").Cells(i + 38, 3).Value)
val4 = CStr(ThisWorkbook.Worksheets("test").Cells(i + 38, 4).Value)