如何避免在Django自定义数据库函数调用的SQL中使用括号?

时间:2016-05-13 09:43:29

标签: python django postgresql django-orm

对问题的简短介绍......

  • PostgreSQL有非常简洁的数组字段(int数组,字符串数组)和函数,如UNNESTANY
  • Django支持这些字段(我正在使用djorm_pgarray),但本机不支持函数。
  • 可以使用.extra(),但Django 1.8引入了database functions的新概念。

让我提供一个最原始的例子,说明我基本上对所有这些做了些什么。 Dealer有一个它支持的品牌列表。 Vehicle有一个品牌并且与经销商相关联。但是,Vehicle的make与Dealer的制作列表不匹配,这是不可避免的。

MAKE_CHOICES = [('honda', 'Honda'), ...]

class Dealer(models.Model):
    make_list = TextArrayField(choices=MAKE_CHOICES)

class Vehicle(models.Model):
    dealer = models.ForeignKey(Dealer, null=True, blank=True)
    make   = models.CharField(max_length=255, choices=MAKE_CHOICES, blank=True)

拥有经销商和制造商的数据库,我想计算所有车辆制造商及其经销商制造商列表匹配的车辆。这就是我如何避免.extra()

from django.db.models import functions

class SelectUnnest(functions.Func):
    function = 'SELECT UNNEST'

...

Vehicle.objects.filter(
    make__in=SelectUnnest('dealer__make_list')
).count()

结果SQL:

SELECT COUNT(*) AS "__count" FROM "myapp_vehicle" 
INNER JOIN "myapp_dealer" 
  ON ( "myapp_vehicle"."dealer_id" = "myapp_dealer"."id" ) 
WHERE "myapp_vehicle"."make" 
  IN (SELECT UNNEST("myapp_dealer"."make_list"))

它的工作原理比我们在Django中使用的传统M2M方法快得多。但是,对于此任务,UNNEST不是一个非常好的解决方案:ANY要快得多。我们来试试吧。

class Any(functions.Func):
    function = 'ANY'

...

Vehicle.objects.filter(
    make=Any('dealer__make_list')
).count()

它生成以下SQL:

 SELECT COUNT(*) AS "__count" FROM "myapp_vehicle" 
 INNER JOIN "myapp_dealer" 
   ON ( "myapp_vehicle"."dealer_id" = "myapp_dealer"."id" )
 WHERE "myapp_vehicle"."make" = 
  (ANY("myapp_dealer"."make_list"))

它失败了,因为ANY周围的大括号是虚假的。如果你删除它们,它会在psql控制台中运行,没有任何问题,而且速度很快。

所以我的问题。

  1. 有没有办法去掉这些牙箍?我在Django文档中找不到任何相关内容。
  2. 如果没有, - 可能还有其他方法可以改写此查询吗?
  3. P上。 S。我认为,针对不同后端的广泛的数据库函数库对于数据库密集的Django应用程序非常有用。

    当然,其中大部分都不是便携式的。但是,您通常不会经常将此类项目从一个数据库后端迁移到另一个数据库后端。在我们的示例中,使用数组字段和PostGIS,我们坚持使用PostgreSQL并且不打算移动。

    有人在开发这样的东西吗?

    P上。 P. S。有人可能会说,在这种情况下,我们应该为make和inarray使用一个单独的表而不是字符串数组,这是正确的并且将会完成,但问题的本质不会改变。

    更新

    • TextArrayField的定义位于djorm_pgarray。在链接的源文件中,您可以看到它的工作原理。
    • 该值是文本字符串列表。在Python中,它表示为列表。示例:['honda', 'mazda', 'anything else']

    以下是数据库中的内容。

    =# select id, make from appname_tablename limit 3;
    id | make
    ---+----------------------
    58 | {vw}
    76 | {lexus,scion,toyota}
    39 | {chevrolet}
    

    基础PostgreSQL字段类型为text[]

1 个答案:

答案 0 :(得分:4)

我设法通过以下方式获得(或多或少)所需内容:

from django.db.models.lookups import BuiltinLookup
from django.db.models.fields import Field

class Any(BuiltinLookup):
    lookup_name = 'any'

    def get_rhs_op(self, connection, rhs):
       return " = ANY(%s)" % (rhs,)

Field.register_lookup(Any)

和查询:

Vehicle.objects.filter(make__any=F('dealer__make_list')).count()

结果:

SELECT COUNT(*) AS "__count" FROM "zz_vehicle"
  INNER JOIN "zz_dealer" ON ("zz_vehicle"."dealer_id" = "zz_dealer"."id")
    WHERE "zz_vehicle"."make"  = ANY(("zz_dealer"."make_list"))

顺便说一句。而是djorm_pgarray和TextArrayField你可以使用原生django:

make_list = ArrayField(models.CharField(max_length=200), blank=True)

(以简化您的依赖关系)