Pony ORM - 按特定订单排序

时间:2016-09-06 17:50:29

标签: python sorting lambda ponyorm

执行Pony ORM查询并尝试按模型上的三个属性对查询进行排序。首先是歌曲类型,它可以是ssf_type_order_map中列出的五个值之一,然后是持续时间(int)和uuid(字符串)。

对于歌曲类型,我希望按以下顺序排列歌曲:Full,Full(Instrumental),Shorts,Loops,Stems

如果我尝试使用以下.order_by()调用进行排序,它不会返回任何错误,但它不按类型排序,因为我需要按上述顺序排序(持续时间和UUID排序工作正常)。

song_source_files = self.song_source_files.select(lambda ssf: True).order_by(lambda ssf: (ssf.type, ssf.duration, ssf.uuid))

这就是我认为理想的查询,将字符串类型映射到按顺序排列的地图。

ssf_type_order_map = {
    'Full': 1,
    'Full (Instrumental)': 2,
    'Shorts': 3,
    'Loops': 4,
    'Stems': 5
}

song_source_files = self.song_source_files.select(lambda ssf: True).order_by(lambda ssf: (ssf_type_order_map[ssf.type], ssf.duration, ssf.uuid))

但是在运行时说“表达式ssf_type_order_map不支持类型'dict'时出现错误。

有关order_by here的Pony ORM文档在这种情况下使用lambdas非常模糊。

更新 - 9月7日

我也尝试在模型上添加以下getter属性,如下所示:

@property
def source_type(self):
  ssf_type_order_map = {
    'Full': 1,
    'Full (Instrumental)': 2,
    'Shorts': 3,
    'Loops': 4,
    'Stems': 5
  }

  return ssy_type_order_map[self.type]

然后尝试按如下方式对查询进行排序:

song_source_files = self.song_source_files.select(lambda ssf: True).order_by(lambda ssf: (ssf_type_order_map[ssf.type], ssf.duration, ssf.uuid))

但是我收到一个错误,基本上说模型没有这个属性。我基于与Django的ORM类似问题的假设是您只能访问数据库模型中存在的属性。

如果Pony就是这种情况,那么如何实现我想要实现的目标呢?

1 个答案:

答案 0 :(得分:3)

首先,我想说Pony区分两种类型的子表达式:外部表达式和相关表达式。外部表达式不依赖于生成器循环变量的值,而相关表达式则依赖于生成器循环变量的值。请考虑以下示例:

from some_module import f, g

x = 100
query = select(e for e in MyEntity if e.attr > f(x, 200) and g(x, e))

在此查询中,我们有两个子表达式:第一个是f(x, 200),第二个是g(x, e)。前者被Pony视为外部表达式,因为它不使用任何循环变量。在这种情况下,Pony假定在查询执行之前可以在Python中计算表达式的值,然后将表达式转换为单个参数。对于这样的表达式,Pony没有对可以在其中使用哪些Python函数施加任何限制,因为这样的表达式的结果只是在Python中评估的单个值。

第二个表达式g(x, e)无法在Python中计算,因为它取决于循环变量e的值。对于不同的表行,这种表达的结果可能不同。因此,Pony需要将这些表达式转换为SQL。并非每个Python表达式都可以转换为SQL,g需要是Pony特别知道如何翻译的函数。 Pony定义了可以翻译的Python操作子集。此子集包括对数字类型的算术运算,字符串方法(如startswithendswithin等)以及聚合函数(如summax) 。

在您的代码中,当您编写

.order_by(lambda ssf: (ssf_type_order_map[ssf.type], ssf.duration, ssf.uuid))

表达式ssf_type_order_map[ssf.type]引用对象变量ssf,因此每个表行都有不同的值,因此这是相关表达式,Pony需要将该表达式转换为SQL。目前Pony不了解如何执行此类特定翻译,但原则上这是可行的。翻译结果将是以下SQL CASE语句:

ORDER BY CASE ssf.type
    WHEN 'Full' THEN 1
    WHEN 'Full (Instrumental)' THEN 2
    WHEN 'Shorts' THEN 3
    WHEN 'Loops' THEN 4
    WHEN 'Stems' THEN 5
    ELSE 0
END

好消息是你可以使用Python if-expression语法在Pony中编写这样的表达式:

(1 if ssf.type == 'Full' else
 2 if ssf.type == 'Full (Instrumental)' else
 3 if ssf.type == 'Shorts' else
 4 if ssf.type == 'Loops' else
 5 if ssf.type == 'Stems' else 0)

此时Pony还不支持反编译if-expression,所以如果你试图直接编写这样的代码,你会得到一个异常。作为一种解决方法,您需要将lambda函数的源作为字符串传递。在这种情况下,它将被正确翻译,因为我们可以直接将字符串解析为AST而不进行反编译。所以你可以写:

song_source_files = self.song_source_files.select().order_by("""
    lambda ssf: ((1 if ssf.type == 'Full' else
                  2 if ssf.type == 'Full (Instrumental)' else
                  3 if ssf.type == 'Shorts' else
                  4 if ssf.type == 'Loops' else
                  5 if ssf.type == 'Stems' else 0),
                 ssf.duration, ssf.uuid)
""")

这应该可以完美地运行,但我建议您以另一种方式解决此问题:我们可以拥有SourceFileTypename属性的code实体,然后订购{{ 1}} ssf值记录:

ssf.type.code

然后可以通过以下方式编写查询:

class SongSourceFile(db.Entity):
    name = Required(str)
    type = Required(lambda: SourceFileType)
    duration = Required(timedelta)
    uuid = Required(uuid.UUID, unique=True, default=uuid.uuid4)

class SourceFileType(db.Entity):
    name = Required(str)
    code = Required(int)
    files = Set(lambda: SongSourceFile)

我认为这种方法更具普遍性,因为除了song_source_files = self.song_source_files.select().order_by( lambda ssf: (ssf.type.code, ssf.duration, ssf.uuid) ) SourceFileType之外,您现在可以向name添加其他有用的属性,并在查询中使用它们。