Django_ORM操作 - 查询

时间:2023-12-24 21:18:19

ORM 操作

必知必会13条

<1> all():
查询所有结果 <2> filter(**kwargs):
它包含了与所给筛选条件相匹配的对象 <3> get(**kwargs):
返回与所给筛选条件相匹配的对象
返回结果有且只有一个,如果符合筛选条件的对象超过一个或者没有都会抛出错误。 <4> exclude(**kwargs):
它包含了与所给筛选条件不匹配的对象 <5> values(*field):
返回一个ValueQuerySet,
运行后得到的不是一系列model的实例化对象,而是一个可迭代的字典序列 <6> values_list(*field):
它与values()非常相似,它返回的是一个元组序列,values返回的是一个字典序列 <7> order_by(*field):
对查询结果排序 <8> reverse():
对查询结果反向排序,请注意reverse()通常只能在具有已定义顺序的QuerySet上调用
(在model类的Meta中指定ordering或调用order_by()方法)。 <9> distinct():
从返回结果中剔除重复纪录
(如果你查询跨越多个表,可能在计算QuerySet时得到重复的结果此时可以使用distinct(),
注意只有在PostgreSQL中支持按字段去重。) <10> count():
返回数据库中匹配查询(QuerySet)的对象数量。 <11> first():
返回第一条记录
.all().first 等效于 .first() <12> last():
返回最后一条记录 <13> exists():
如果QuerySet包含数据,就返回True,否则返回False 

返回QuerySet对象的方法有

all()
filter()
exclude()
order_by()
reverse()
distinct()

特殊的QuerySet

values() 返回一个可迭代的字典序列
values_list() 返回一个可迭代的元祖序列
     具体的对象是无法使用这两个方法的
  原理上来说models.py 里面的 class类 中就没有 这两个属性
  这两个属性只针对于一个QuerySet序列集进行筛选才可以使用
    比如 .filter(id=1) 虽然只返回了一个QuerySet对象 但是也可以使用

返回具体对象的

get()
first()
last()

  对象可以直接 .属性 的方法去取值
  原理上来说在数据库对象的里面就有属性自然是可以知己调用的

返回布尔值的方法

exists()

返回数字的方法有

count()

对象和QuerySet对象的区别

具体对象

  •   可以直接 .属性 的方法去取值
  •   本质上来说具体对象就是 models.py 里面的 class类的实例化,本身就有属性可以自己调用
    • 无法使用values()和values_list()的, 因为自己的属性里面就没有
    • 没有 .update() 方法, 在QuerySet对象才可以调用

QuerySet对象

  •   可以调用values()和values_list()
  •   这两个属性只针对于一个QuerySet序列集进行筛选才可以使用
    • 比如 .filter(id=1) 虽然只返回了一个QuerySet对象 但是也可以使用

转换

  QuerySet对象------>具体对象

    QuerySet对象.first()

    QuerySet对象[0]

# 查询 "部门表" 的全部内容
# 查询的时候不带 values或者values_list 默认就是查询 all() ret = models.Employee.objects.all()
# """
# SELECT `employee`.`id`, `employee`.`name`, `employee`.`age`, `employee`.`salary`, `employee`.`province`, `employee`.`dept` FROM `employee` LIMIT 21; args=()
# """ # 查询所有人的 "部门" 和 "年龄"
# values 或者 values_list 里面写什么就相当于 select 什么字段 ret = models.Employee.objects.all().values("dept", "age")
# """
# SELECT `employee`.`dept`, `employee`.`age` FROM `employee` LIMIT 21; args=()
# """

单表查询之神奇的双下划线

models.Tb1.objects.filter(id__lt=10, id__gt=1)    # 获取id大于1 且 小于10的值

models.Tb1.objects.filter(id__in=[11, 22, 33])    # 获取id等于11、22、33的数据

models.Tb1.objects.exclude(id__in=[11, 22, 33])   # not in

models.Tb1.objects.filter(name__contains="ven")   # 获取name字段包含"ven"的

models.Tb1.objects.filter(name__icontains="ven")  # icontains大小写不敏感

models.Tb1.objects.filter(id__range=[1, 3])      # id范围是1到3的,等价于SQL的bettwen and 左右都包含

# 类似的还有:startswith,istartswith, endswith, iendswith 

# date字段还可以单独将年月日拿出来

models.Class.objects.filter(birtday__year=2017)
models.Class.objects.filter(birtday__month=7)
models.Class.objects.filter(birtday__day=17)

基础查询操作

基于对象关联查询

一对多查询(Book--Publish)

正向查询,按字段

book_obj.publish : 与这本书关联的出版社对象 
book_obj.publish.addr: 与这本书关联的出版社的地址

反向查询,按表名_set

publish_obj.book_set: 与这个出版社关联的书籍对象集合    
publish_obj.book_set.all() :[obj1,obj2,....]

一对一查询(Author---AuthorDetail)

正向查询,按字段

author_obj.ad : 与这个作者关联的作者详细信息对象

反向查询:按表名

author_detail_obj.author : 与这个作者详细对象关联的作者对象

多对多(Book----Author)

正向查询,按字段

book_obj.authorList.all(): 与这本书关联的所有这作者对象的集合 [obj1,obj2,....]

book_obj.authorList.all().values("name"): 如果想查单个值的时候可以这样查

反向查询,按表名_set

author_obj.book_set.all() : 与这个作者关联的所有书籍对象的集合

book_obj.book_set.all().values("name"): 如果想查单个值的时候可以这样查

基于双下滑线的跨表查询(queryset对象查询)

一对多查询(Book--Publish)

正向查询,按字段

# 查询linux这本书的出版社的名字:
models.Book.objects.all().filter(title="linux").values("publish__name")

反向查询:按表名

# 查询人民出版社出版过的所有书籍的名字
models.Publish.objects.filter(name="人民出版社出版").values("book__title")

一对一查询(Author---AuthorDetail)  

正向查询,按字段

#查询egon的手机号
models.Author.objects.filter(name="egon").values("ad__tel")

反向查询:按表名

#查询手机号是151的作者
models.AuthorDetail.objects.filter(tel="").values("author__name")

多对多(Book----Author)  

正向查询,按字段

#查询python这本书的作者的名字
models.Book.objects.filter(title="python").values("authorList__name") [{},{},{},{}]

反向查询,按表名

#查询alex出版过的出的价格
models.Author.objects.filter(name="alex").values("book__price")

ps:

  如果哟有设置,反向查询的时候都用:related_name 的值

publish=models.ForeignKey("Publish",related_name="bookList")
authorlist=models.ManyToManyField("Author",related_name="bookList")
ad=models.models.OneToOneField("AuthorDetail",related_name="authorInfo")

ManyToManyField

概念原理

    利用 关联管理器 进行维护

    • 外键关系的反向查询
    • 多对多关联关系

create()

    创建一个新的对象,保存对象,并将它添加到关联对象集之中,返回新创建的对象。

models.Author.objects.first().book_set.create(title="羊驼之歌", publish_id=2)

add()

    把指定的model对象添加到关联对象集中。

添加对象
>>> author_objs = models.Author.objects.filter(id__lt=3)
>>> models.Book.objects.first().authors.add(*author_objs)

添加id
>>> models.Book.objects.first().authors.add(*[1, 2])

set()

    更新model对象的关联对象。

book_obj = models.Book.objects.first()
book_obj.authors.set([2, 3])

remove()

    从关联对象集中移除执行的model对象

book_obj = models.Book.objects.first()
author_obj.books.remove(book_obj)
author_obj.books.remove(8)   # 把id = 8 的书删掉

clear()   

从关联对象移除一切对象。

book_obj = models.Book.objects.first()
book_obj.authors.clear()

注意:

对于ForeignKey对象,clear()和remove()方法仅在null=True时存在。

# ForeignKey字段没设置null=True时,
class Book(models.Model):
title = models.CharField(max_length=32)
publisher = models.ForeignKey(to=Publisher) # 没有clear()和remove()方法:
>>> models.Publisher.objects.first().book_set.clear()
Traceback (most recent call last):
File "<input>", line 1, in <module>
AttributeError: 'RelatedManager' object has no attribute 'clear' # 当ForeignKey字段设置null=True时,
class Book(models.Model):
name = models.CharField(max_length=32)
publisher = models.ForeignKey(to=Class, null=True) # 此时就有clear()和remove()方法:
dels.Publisher.objects.first().book_set.clear()

注意

  对于所有类型的关联字段,add()、create()、remove() 和 clear(), set() 都会马上更新数据库。

  换句话说,在关联的任何一端,都不需要再调用save()方法。

基于对象以及 queryset 对象的综合查询示例

 from django.shortcuts import render,HttpResponse

 # Create your views here.

 from app01 import models

 def query(request):

     # #####################基于对象查询(子查询)##############################
# 按字段(publish)
# 一对多 book -----------------> publish
# <----------------
# book_set.all() # 正向查询按字段: # 查询python这本书籍的出版社的邮箱 # python=models.Book.objects.filter(title="python").first()
# print(python.publish.email) # 反向查询按 表名小写_set.all() # 苹果出版社出版的书籍名称 # publish_obj=models.Publish.objects.filter(name="苹果出版社").first()
# for obj in publish_obj.book_set.all():
# print(obj.title) # 按字段(authors.all())
# 多对多 book -----------------------> author
# <----------------
# book_set.all() # 查询python作者的年龄
# python = models.Book.objects.filter(title="python").first()
# for author in python.authors.all():
# print(author.name ,author.age) # 查询alex出版过的书籍名称 # alex=models.Author.objects.filter(name="alex").first()
# for book in alex.book_set.all():
# print(book.title) # 按字段 authorDetail
# 一对一 author -----------------------> authordetail
# <----------------
# 按表名 author #查询alex的手机号
# alex=models.Author.objects.filter(name='alex').first()
# print(alex.authorDetail.telephone) # 查询家在山东的作者名字 # ad_list=models.AuthorDetail.objects.filter(addr="shandong")
#
# for ad in ad_list:
# print(ad.author.name) '''
对应sql: select publish_id from Book where title="python"
select email from Publish where nid = 1 ''' # #####################基于queryset和__查询(join查询)############################ # 正向查询:按字段 反向查询:表名小写 # 查询python这本书籍的出版社的邮箱
# ret=models.Book.objects.filter(title="python").values("publish__email")
# print(ret.query) '''
select publish.email from Book
left join Publish on book.publish_id=publish.nid
where book.title="python"
''' # 苹果出版社出版的书籍名称
# 方式1:
ret1=models.Publish.objects.filter(name="苹果出版社").values("book__title")
print("111111111====>",ret1.query)
#方式2:
ret2=models.Book.objects.filter(publish__name="苹果出版社").values("title")
print("2222222222====>", ret2.query) #查询alex的手机号
# 方式1:
ret=models.Author.objects.filter(name="alex").values("authorDetail__telephone") # 方式2:
models.AuthorDetail.objects.filter(author__name="alex").values("telephone") # 查询手机号以151开头的作者出版过的书籍名称以及书籍对应的出版社名称 ret=models.Book.objects.filter(authors__authorDetail__telephone__startswith="").values('title',"publish__name")
print(ret.query) return HttpResponse("OK")

queryset对象特性及优化

特性: 

  惰性执行

books = BookInfo.objects.all() # 此时,数据库并不会进行实际查询
# 只有当真正使用时,如遍历的时候,才会真正去数据库进行查询
for b in books:
print(b)

  缓存

# 进行数据库实际查询遍历,保存结果到bs,会进行数据库实际交互
bs = [b.id for b in BookInfo.objects.all()] # 再次调用缓存结果bs,不再进行数据库查询,而是使用缓存结果

优化方法:

  exists()

  简单的使用if语句进行判断也会完全执行整个queryset并且把数据放入cache,虽然你并不需要这些数据!为了避免这个,可以用exists()方法来检查是否有数据:

if queryResult.exists():
#SELECT (1) AS "a" FROM "blog_article" LIMIT 1; args=()
print("exists...")

  iterator()

  当queryset非常巨大时,cache会成为问题。

  处理成千上万的记录时,巨大的queryset可能会锁住系统进程,让你的程序濒临崩溃。

  要避免在遍历数据的同时产生queryset cache,可以使用 iterator() 方法 来获取数据,处理完数据就将其丢弃

objs = Book.objects.all().iterator()

# iterator()可以一次只从数据库获取少量数据,这样可以节省内存
for obj in objs:
print(obj.title) # 基于迭代器的特性,被遍历到底部之后下次在使用是无效的了。
for obj in objs:
print(obj.title)

  使用 .iterator() 来防止生成cache,意味着遍历同一个queryset时会重复执行查询.

  所以使 用 .iterator() 时需确保操作一个大queryset时没有重复执行查询.

总结:      

  Queryset的cache是用于减少程序对数据库的查询,在通常的使用下会保证只有在需要的时候才会查询数据库。

  使用exists()和iterator()方法可以优化程序对内存的使用。不过,由于它们并不会生成queryset cache,可能 会造成额外的数据库查询。 

聚合

导入

from django.db.models import Avg, Sum, Max, Min, Count

示例

>>> from django.db.models import Avg, Sum, Max, Min, Count
>>> models.Book.objects.all().aggregate(Avg("price"))
{'price__avg': 13.233333}
# 指定名称
>>> models.Book.objects.aggregate(average_price=Avg('price'))
{'average_price': 13.233333} # 多次聚合
>>> models.Book.objects.all().aggregate(Avg("price"), Max("price"), Min("price"))
{'price__avg': 13.233333, 'price__max': Decimal('19.90'), 'price__min': Decimal('9.90')}

 注意:

  aggregate 返回的是一个字典,而不是queryset 对象

分组

命令

Employee.objects.values("dept").annotate(avg=Avg("salary").values(dept, "avg")

示例

# 每个 “省” 的 “平均工资” , 查询后的结果为 “省 : 平均工资 ”
# annotate前面是什么就按照什么来分组,annotate后面的字段是被分组后被计算的新增数据列, ret = models.Employee.objects.values("province").annotate(a=Avg("salary")).values("province", "a")
# """
# SELECT `employee`.`province`, AVG(`employee`.`salary`) AS `a` FROM `employee` GROUP BY `employee`.`province` ORDER BY NULL LIMIT 21; args=()
# """
# 统计每一本书的作者个数
book_list = models.Book.objects.all().annotate(author_num=Count("author")) # 统计出每个出版社买的最便宜的书的价格
publisher_list = models.Publisher.objects.annotate(min_price=Min("book__price"))
publisher_list = models.Book.objects.values("publisher__name").annotate(min_price=Min("price")) # 统计不止一个作者的图书
book_list = models.Book.objects.annotate(author_num=Count("author")).filter(author_num__gt=1) # 根据一本图书作者数量的多少对查询集 QuerySet进行排序
book_list = models.Book.objects.annotate(author_num=Count("author")).order_by("author_num") # 查询各个作者出的书的总价格
author_list = models.author.annotate(sum_price=Sum("book__price")).values("name", "sum_price"))
# ORM连表分组查询
# 根据 "部门" 计算出 "平均工资" 结果为显示为 "部门名字 : 平均工资" 的表 ret = models.Person.objects.values("dept_id").annotate(a=Avg("salary")).values("dept__name", "a")
# """
# SELECT `dept`.`name`, AVG(`person`.`salary`) AS `a` FROM `person` INNER JOIN `dept` ON (`person`.`dept_id` = `dept`.`id`) GROUP BY `person`.`dept_id`, `dept`.`name` ORDER BY NULL LIMIT 21; args=()
# """

查询每个部门的员工的员工数

关键点:

  • queryset 对象.anntate() 
  • anntate 按前面的 select 字段进行 group by 分组统计 ,
  • anntate() 的返回值依旧是 queryset 对象 ,  只是增加了分组统计后的键值对
  • 即  " 分组规则 "  .anntate(" 连表操作,数据处理 ") . " 筛选字段 "
    • 分组规则 :
      • 基于queryset 方法 对分组关键字段进行筛选
        • 即 "根据"什么
        • 转换成 sql 语句 为 group by 后面的部分
    • 连表操作,数据处理:
      • 视情况进行是否连表,以及新增一个计算出的字段
        • " 计算 " 什么
    • 筛选字段:
      • 基于queryset 方法 对新增字段进行筛选 并呈现最终结果
        • 即 "想要" 什么
        • 转换成 sql 语句 为 select 后面的部分

分组查询的超级详细的解析示例:

  查询每个部门的员工总工总人数

Django_ORM操作 -  查询

Django_ORM操作 -  查询

Django_ORM操作 -  查询

F查询

概念

    对于基础的两个值得比较可以通过上面的方法实现

    但是对于两个字段的比较则需要用到 F 查询

示例

# 查询评论数大于收藏数的书籍
from django.db.models import F
models.Book.objects.filter(commnet_num__gt=F('keep_num')) # Django 支持 F() 对象之间以及 F() 对象和常数之间的加减乘除和取模的操作。
models.Book.objects.filter(commnet_num__lt=F('keep_num')*2) # 对整个字段的所有值的操作也可以通过 F 函数实现
# 比如将每一本书的价格提高30元
models.Book.objects.all().update(price=F("price")+30)

    关于修改 char 字段的操作

# 把所有书名后面加上(第一版)
>>> from django.db.models.functions import Concat
>>> from django.db.models import Value
>>> models.Book.objects.all().update(title=Concat(F("title"), Value("("), Value("第一版"), Value(")")))

Q查询

概念

    当使用filter 的时候 ,内部多个筛选条件是 and 的关系

    若需求为 or 的关系需要用到 Q 查询

示例

# 查询作者名是羊驼或山羊的
models.Book.objects.filter(Q(authors__name="羊驼")|Q(authors__name="山羊"))

复杂示例

# 可以组合& 和| 操作符以及使用括号进行分组来编写任意复杂的Q 对象。同时,Q 对象可以使用~ 操作符取反,这允许组合正常的查询和取反(NOT) 查询。

# 查询作者名字是羊驼之歌并且不是2018年出版的书的书名。
models.Book.objects.filter(Q(author__name="羊驼之歌") & ~Q(publish_date__year=2018)).values_list("title")

注意

    当 and 和 or 同时一起用的时候 , Q 查询需要放在前面

示例

# 查询出版年份是2017或2018,书名中带羊驼的所有书。
models.Book.objects.filter(Q(publish_date__year=2018) | Q(publish_date__year=2017), title__icontains="羊驼")

Q查询的另一种方法:

    此方法比通常使用稍微复杂一些。本质上和  .filter(Q(title="yang")|Q(price=123)) 实现效果相同,

    但是 这样子拆分出来可以实现 不在使用字段对象,而是用字符串来筛选

场景适用:

      搜索框获取当前get 请求中的参数时,参数为字符串形式,用常规的Q查询必须依靠字段对象从而无法实现

q = Q()                    # 将Q实例化对象单独拿出来
q.connnection = "or"            # 默认多条件的关系是 "and" 通过connection 可以改成其他
q.children.append(("title", "yang"))  # 添加查询字段
q.children.append(("price", 123))

  限制住当前查询结束后才可以其他的操作.保证数据的可靠性

select_for_update(nowait=False, skip_locked=False)

示例

entries = Entry.objects.select_for_update().filter(author=request.user)

执行原生的sql 语句

 # 查询person表,判断每个人的工资是否大于2000
# 利用子查询,可以写入原生的sql语句
ret = models.Person.objects.all().extra(
select={"gt": "salary > 2000"}
) # """
# SELECT (salary > 2000) AS `gt`, `person`.`id`, `person`.`name`, `person`.`salary`, `person`.`dept_id` FROM `person` LIMIT 21; args=()
# """ for i in ret:
print(i.name, i.gt)
 # 执行完全的原生的SQL语句,类似pymql
from django.db import connection
cursor = connection.cursor() # 获取光标,等待执行SQL语句
cursor.execute("""SELECT * from person where id = %s""", [1])
row = cursor.fetchone()
print(row)