我在理解Django中的原始查询行为时遇到了问题。问题在于使用RawQuerySet时对数据库的查询数量。看起来每次我使用RawQuerySet时都会发送新的数据库查询。例如,使用此代码:
reviews = Reviews.objects.raw('select * from reviews rv [...]')
count = len(list(reviews))
avg_rating = 0.0
if count > 0:
for r in reviews:
avg_rating = avg_rating + r.stars
avg_rating = avg_rating/float(count)
avg_rating = avg_rating/float(count)
每次使用“评论”都会产生新的,相同的查询。为什么RawQuerySet如此懒惰?在我看来,一旦有人决定使用原始查询,他就不需要Django的额外“帮助”了。我错过了什么吗?有没有办法在这种情况下只做一个查询?对,知道我决定将Reviews.objects.raw()转换为list()并且它有所帮助,但它仍然困扰我为什么这样做。
答案 0 :(得分:0)
问题来自你的list(reviews)
表达式 - 这迫使RawQuerySet尝试以这种或那种方式从初始查询构建完整模型实例(可能不是以最有效的方式,但这是另一个故事)。如果没有这一行并且假设您没有访问相关对象,则只会进行一次查询,如您在此代码段中所示:
>>> from survey.models import Question
>>> from django.db import connection
>>> import pprint
>>> connection.queries
[]
>>> raw = Question.objects.raw("select * from survey_question")
>>> for q in raw:
... print q.id
...
1
2
3
4
>>> connection.queries
[{'time': '0.000', 'sql': 'select * from survey_question'}]
>>> list(raw)
[<Question: Survey Essai1 (root) question #1 - Depuis combien de temps programmez vous ?>, <Question: Survey Essai1 (root) question #2 - Comment avez vous débuté ?>, <Question: Survey Essai1 (root) question #3 - Quel est votre niveau de formation>, <Question: Survey Essai1 (root) question #4 - Cette formation porte-t-elle sur l'informatique ?>]
>>> pprint.pprint(connection.queries)
[{'sql': 'select * from survey_question', 'time': '0.000'},
{'sql': 'select * from survey_question', 'time': '0.000'},
{'sql': 'SELECT `survey_survey`.`id`, `survey_survey`.`user_id`, `survey_survey`.`title`, `survey_survey`.`notes`, `survey_survey`.`description`, `survey_survey`.`instructions`, `survey_survey`.`date_created`, `survey_survey`.`starts_on`, `survey_survey`.`ends_on` FROM `survey_survey` WHERE `survey_survey`.`id` = 1 ',
'time': '0.001'},
{'sql': 'SELECT `auth_user`.`id`, `auth_user`.`username`, `auth_user`.`first_name`, `auth_user`.`last_name`, `auth_user`.`email`, `auth_user`.`password`, `auth_user`.`is_staff`, `auth_user`.`is_active`, `auth_user`.`is_superuser`, `auth_user`.`last_login`, `auth_user`.`date_joined` FROM `auth_user` WHERE `auth_user`.`id` = 1 ',
'time': '0.001'},
{'sql': 'SELECT `survey_survey`.`id`, `survey_survey`.`user_id`, `survey_survey`.`title`, `survey_survey`.`notes`, `survey_survey`.`description`, `survey_survey`.`instructions`, `survey_survey`.`date_created`, `survey_survey`.`starts_on`, `survey_survey`.`ends_on` FROM `survey_survey` WHERE `survey_survey`.`id` = 1 ',
'time': '0.000'},
{'sql': 'SELECT `auth_user`.`id`, `auth_user`.`username`, `auth_user`.`first_name`, `auth_user`.`last_name`, `auth_user`.`email`, `auth_user`.`password`, `auth_user`.`is_staff`, `auth_user`.`is_active`, `auth_user`.`is_superuser`, `auth_user`.`last_login`, `auth_user`.`date_joined` FROM `auth_user` WHERE `auth_user`.`id` = 1 ',
'time': '0.000'},
{'sql': 'SELECT `survey_survey`.`id`, `survey_survey`.`user_id`, `survey_survey`.`title`, `survey_survey`.`notes`, `survey_survey`.`description`, `survey_survey`.`instructions`, `survey_survey`.`date_created`, `survey_survey`.`starts_on`, `survey_survey`.`ends_on` FROM `survey_survey` WHERE `survey_survey`.`id` = 1 ',
'time': '0.000'},
{'sql': 'SELECT `auth_user`.`id`, `auth_user`.`username`, `auth_user`.`first_name`, `auth_user`.`last_name`, `auth_user`.`email`, `auth_user`.`password`, `auth_user`.`is_staff`, `auth_user`.`is_active`, `auth_user`.`is_superuser`, `auth_user`.`last_login`, `auth_user`.`date_joined` FROM `auth_user` WHERE `auth_user`.`id` = 1 ',
'time': '0.000'},
{'sql': 'SELECT `survey_survey`.`id`, `survey_survey`.`user_id`, `survey_survey`.`title`, `survey_survey`.`notes`, `survey_survey`.`description`, `survey_survey`.`instructions`, `survey_survey`.`date_created`, `survey_survey`.`starts_on`, `survey_survey`.`ends_on` FROM `survey_survey` WHERE `survey_survey`.`id` = 1 ',
'time': '0.000'},
{'sql': 'SELECT `auth_user`.`id`, `auth_user`.`username`, `auth_user`.`first_name`, `auth_user`.`last_name`, `auth_user`.`email`, `auth_user`.`password`, `auth_user`.`is_staff`, `auth_user`.`is_active`, `auth_user`.`is_superuser`, `auth_user`.`last_login`, `auth_user`.`date_joined` FROM `auth_user` WHERE `auth_user`.`id` = 1 ',
'time': '0.000'}]
>>>
现在重点是:为什么你要使用RawQueryset进行上述计算?
我假设第一个avg_rating = avg_rating/float(count)
行是循环中的那个 - 是一个复制粘贴错误(如果不是,我很想知道你对“平均”的定义的更多信息)。然后你只需要一个查询(不需要循环或python计算)来要求数据库进行计算。你可以使用raw sql:
select avg(stars) from reviews;
或使用ORM的聚合函数(参见https://docs.djangoproject.com/en/1.4/topics/db/aggregation/):
>>> from django.db.models import Avg
>>> Book.objects.all().aggregate(Avg('price'))