Django分组聚合查询实例分享

(编辑：jimmy 日期: 2024/11/18 浏览：3 次 )

多表查询

1. 增删改

一对多：先一后多，外键可以为对象或依赖表的主键（publish and book)

publish = Publish.objects.create()
Book.objects.create(....publish=publish|publish_id=publish.id)

删：默认存在级联删除

改： book修改外键，外键一定存在

多对多：

关系表的获取（book(主键) and author) book.author

增：book.author.add（作者对象们|主键们）

删： clear()清除 remove() 可删除单个作者

改： set([作者对象们|主键们])

2. 查

基于对象，正向找属性，反向找类名小写，多条记录类名小写_set

book.publish.first().name (book 一定是对象，不是queryset)
publish.book_set.first().name

基于双下划线：

Book.objects.filter(id=1).values('publish__name')[0] (values 查出的也是queryset)
publish.values('book__name')

今日内容

1. 分组查询：聚合结果 group_by()

2. 聚合函数

3. 字段

分组查询(单独聚合查询 and 分组聚合查询---基于mysql)

Book: id name price publish_date publish

聚合函数可以单独使用 ---- 整张表是一个大组

select max(price) from book

聚合函数在分组下使用

select max(price) as high_price from book group by publish having high_price > 50;

聚合查询---基于ORM

聚合函数的使用场景：

单独使用：不分组，只查聚合结果

分组使用：按字段分组，可查分组字段与聚合结果

导入聚合函数：

from django.db.models import Avg,Max,Min,Count,Sum

单独聚合查询：aggregate (聚集，合集)---不分组

# 语法

# 聚合函数： Max, Min,Sum, Avg, Count

aggregate(别名=聚合函数（'字段‘)

规则：

1. 可以同时对多个字段进行聚合处理： aggregate(name1= , name2= ...)

2. 是QuerySet 对象的方法（all,filter)

3. 返回值为dict类型

4. 在aggregate之前的values操作没作用，被忽略

例：所有书中最贵的书的价格

dic = Book.objects.all().aggregate(high_price=max('price),low_price=min('price'))

分组聚合查询： annotate (注释，做注解) --- 分组

# 语法
values('分组字段').annotate(别名=聚合函数（‘字段'）.filter(聚合别名条件).values('取分组字段','取聚合字段别名'))

规则：

1. values --- annotate 分组组合， values控制分组的字段，annotate控制聚合字段

2. values 可以按多个字段分组values('字段1‘，'字段2‘)

3. 可以同时对多个字段进行聚合处理 annotate(别名1=max('price'),别名2=min('price'))

4. 分组后的filter 代表having判断，只对聚合字段进行条件判断，（参数为非聚合或分组进行条件判断代表where判断）

5. 取字段值 values() 省略默认取所有分组字段和聚合字段，也可以自己定义（对非分组或非聚合字段，该字段自动被变成分组字段）

# 案例：每个出版社出版的最贵的书的价格高于50元的出版社名与最高价格

# 思路：按出版社分组(从book出发），high_price=max('price'), filter(high_price__gt=50)

# 每个组的价格最贵的

Book.objects.all().values('publish__name').annotate(high_price=max('price').filter(high_price__gl=50).values('publish__name','high_price'))

字段属性

1. null: 默认Fasle(默认字段不能为空) ， True 表示字段可为null
2. blank: 默认False, True 表示字段可以为空
3.choice: 限制了该选项字段值必须是指定的choice 中的一个 (元组套元组)
sex = models.SmallIntegerField(choice=((1,'man'),(2,'female')))
obj.get_sex_display()

有choices 这个字段的：要取得'女‘或'男‘， get_字段名sex_display() --超出失效
4. db_column: 自定义字段名
db_column='gender' 起别名该sex
5. db_index : True 设置索引
6. default: 字段默认值
7. editable: 默认为True, False: 不在 admin 界面显示
8. primary_key ： TRUE 为主键，
9. unique: true 字段值不可重复

字段

1. AutoField(): 默认自增主键（primary_key=True)
2. BooleanField(): 布尔字段，对应database tinyint 类型
3. CharField(): 字符类型（默认不为空）
max_length=20,null=True 可以为空
4. DateField(): 年月日
auto_now = True 数据别更新就会更新时间
auto_now_add = True 数据第一次产生时
5. DateTimeField(): 年月日时分秒
auto_now = True 数据别更新就会更新时间
auto_now_add = True 数据第一次产生时
6. DecimalField(): 混合精度的小数类型
max_digits = 5, 含小数为的最大位数
decimal_places = 2 , 小数位数
7. IntegerField(): 整型

不常用字段

关系字段

1. ForeignKey(): 外键字段
to= 关联模型类（一对多）
to_file = 关联字段，省略默认关联主键
on_delete (外键关联数据被删除时的操作)
models.CASCADE 级联删除
modles.PROTECT 抛出异常
models.SET_NULL 设置空值
modles.SET_DEFAULT 设置默认值
models.SET(value) 自定义值
related_name 自定义反向查询的字段名
db_constraint=False, 取消关联，但还可以使用链表查询
总结： models.ForeignKey(to='related class name', null=True,on_delete=models.SET_NULL,db_constraint=False,related_name='本类名小写')
2. OneToOneField(): 一对一字段
同外键
3， ManyToManyField() :多对多关系
to = 关联模型类
through=关联关系类
through_fields关联关系表中（本身字段，关联字段）

断开外键关联的ForeignKey使用（一对多，一对一）

# 一对多查询 ----（publish and book）
# 方式一：不使用外键，在book 中添加 publish_id 属性
# 不在支持Django ORM 链表查询语法

# class Book(models.Model):
# name = models.CharField(max_length=20)
# publish_id = models.IntegerField(null=True)
#
# class Publish(models.Model):
# name = models.CharField(max_length=20)
#
# # 查询方式：
# # 通过第一本书book 找出版社
# # id = Book.objects.first().publish_id
# # publish = Publish.objects.filter(id=id)[0].name
# # print(publish)

方式二：使用外键，用db_constrain=False 字段段开连接
# 可以使用Django ORM连表查询语法
class Book(models.Model):
name = models.CharField(max_length=20)
publish = models.ForeignKey(to='Publish',db_constraint=False,null=True,on_delete=models.SET_NULL) # to_field='id' 不写会自动添加

class Publish(models.Model):
name = models.CharField(max_length=20)

# 书的出版社（外键方式）
# print(Book.objects.first().publish.name)
# print(Book.objects.filter(pk=1).values('publish__name'))

断开关联--- 多对多自动创建关系表

# 断开关联(db_constraint属性）的多对多自动创建关系表（book(外键） and author)
# 断开后依然支持Django ORMlianiao 查询语法
# 当新表中无需新加额外字段时，可以自动创建
class MyBook(models.Model):
name = models.CharField(max_length=20)
# 这里会产生第三张表
book_author = models.ManyToManyField(to='MyAuthor',db_constraint=False)

class MyAuthor(models.Model):
name = models.CharField(max_length=20)

# # 查询方法
# # 多对多（自动创建第三张表）：书的作者
# b1 = MyBook.objects.first()
# # b1.book_author 这个是关系表
# for author in b1.book_author.all():
# print(author.name)

# print(MyBook.objects.filter(pk=1).values('book_author__name'))

断开关联 --- 多对多手动创建关系表

# 手动创建关系表的原因：可以拥有自身字段，可以通过关系表类名直接获取第三张表

# 手动创建关系表可以让关系表可以拥有更多的自身的字段，同时通过关系表类名可以直接获取第三张表
'''
# ****
# 1、和自动建立关系表类似，依然支持Django ORM连表查询语法(多对多借助关系表连表查询)
class Book(models.Model):
name = models.CharField(max_length=20)

class Author(models.Model):
name = models.CharField(max_length=20)

class Book_Author(models.Model):
book = models.ForeignKey(to="Book", null=True, on_delete=models.SET_NULL, db_constraint=False)
author = models.ForeignKey(to='Author', null=True, on_delete=models.SET_NULL, db_constraint=False)
time = models.DateField()
'''

'''
# ****
2、手动创建关系表，在关系表中用ForeignKey方式支持基于外键关系表的ORM连表查询，同时明确ManyToManyField字段，所以也支持ORM正向方向连表查询
-- db_constraint=False断开关联可以在ForeignKey或ManyToManyField任意一方完成
class Book(models.Model):
name = models.CharField(max_length=20)
# 明确through与through_fields，ManyToManyField才不会自动建立关系表，没有关联关系后就不能再使用db_constraint字段属性
author = models.ManyToManyField(to='Author', through='Book_Author', through_fields=('book_id', 'author_id'))

class Author(models.Model):
name = models.CharField(max_length=20)

class Book_Author(models.Model):
book = models.ForeignKey(to="Book", null=True, on_delete=models.SET_NULL, db_constraint=False)
author = models.ForeignKey(to='Author', null=True, on_delete=models.SET_NULL, db_constraint=False)
time = models.DateField()
'''
# 总结：手动创建第三张表，第三张表的增删改就采用关系表类名衍生的create|delete|update，就不再拥有add|clear|remove|set（因为关系表拥有自己的字段，这些方法无法直接操作这些字段）

上一篇：基于python连接oracle导并出数据文件
下一篇：numpy库ndarray多维数组的维度变换方法(reshape、resize、swapaxes、flatten)