python迭代器和生成器(3元运算,列表生成式,生成器表达式,生成器函数)

时间:2022-08-11 17:06:21

1.1迭代器

什么是迭代器:

迭代器是一个可以记住遍历的位置对象

迭代器对象从集合的第一个元素元素开始访问,直到所有元素被访问完结束,迭代器只能往前不会后退。

迭代器有两个基本方法:iter ,next 方法

内置函数iter(),next()  本质上都是用的对象.__iter__(),__next__()的方法

内置函数 iter(iterable),表示把可迭代对象 变成迭代器(iterator)

内置函数next(iterator) ,表示查看下一次迭代的值(当然也可以用 iterator.__next__() ,查看下一次迭代的值)

1.1.2迭代器协议

1.迭代器(iterator)协议是指:对象必须提供一共next方法,执行该方法妖魔返回迭代中的下一项,要么就引起一个Stopiteration异常,已终止迭代。

2.可迭代对象:实现了迭代器协议的对象,(该对象内部定义了一个__iter__()的方法  例:str.__iter__())就是可迭代对象

3.协议是一种约定,可迭代对象实现了迭代器协议,python的内部工具(如。for循环,sum,min,max函数等)使用迭代器协议访问对象

1.1.3python中的for循环

for循环本质:循环所有对象,全部是使用迭代器协议

(字符串,列表,元祖,字典,集合,文件对象),这些都不是可迭代对象,只不过在for循环,调用了他们内部的__iter__方法,把他们变成了可迭代对象。然后for循环调用可迭代对象的__next__方法去去找,然后for循环会自动捕捉StopIteration异常,来终止循环。

 l1 = ["hello","world",1,2]

 #for循环调用可迭代对象的__next__方法去取值,而且for循环会捕捉StopIteration异常,以终止对象
for i in l1:
print(i) aa = l1.__iter__() #等同于内置函数aa = iter(l1) 创建了一个list_iterator 列表迭代器
print(type(aa))
print(next(aa)) #内置函数 next()查看第一次迭代器的值
print(aa.__next__()) #迭代器本身对象的方法,第二次迭代器的值 跟 内置函数方法都是一样的
print(next(aa))
print(next(aa))
print(next(aa)) #没有可迭代的值了也就是迭代完了,会报错:StopIteration #迭代器迭代完,就不能再次迭代该迭代器 比如for 循环
for i in aa:
print(i)

demo

 # 首先获得Iterator对象:
it = iter([1, 2, 3, 4, 5]) #创建一个迭代器
# 循环:
while True:
try:
# 获得下一个值:
x = next(it)
print(x)
except StopIteration:
# 遇到StopIteration就退出循环
break

demo2 :循环比迭代器更强大

总结:

1.可作用于for循环对象本身都是iterable(可迭代对象)类型,或者对象本身有obj.__iter__方法也是iterable

2.凡是可作用于next()函数的对象本身itertor(迭代器)类型,或者obj.__next__也是iterator ,迭代器是一个惰性序列

因为需要调用next,才会获得元素,迭代完,就不能再次迭代。

3.list、dict、str等是iterable,但不是iterator不过可以通过iter()函数获得一个迭代器对象。

1.2生成器

什么是生成器?

1.从字面理解是不是:生成一个容器

2.在python中,一边循环,一边计算的机制,称为生成器(generator)。

3.可以理解为一种数据类型,这种类型自动实现了迭代器协议。(其他的数据类型需要调用自已的内置__iter__方法或则iter()的内置函数),所以生成器就是一个可迭代对象。

生成器分类以及在python中的表现形式。(python有两种不同的方式提供生成器)

1.生成器函数:常规函数定义,但是,使用yield语句而不是return语句的返回结果。yield语句一次返回一个结果,在每个结果中间,保留函数的状态,以便再上一次状态的重新执行。

2.生成器表达式:类似于列表推导,但是生成器返回按需产生结果的一种对象,而不是一次构建一个结果列表

为何使用生成器,生成器的优点:

python使用生成器对延迟操作提供了支持。所谓延迟操作,是指需要的时候才产生结果,而不是立即生成结果

这就是生成器的好处

生成器小结:

1.生成器是可迭代对象

2.实现了延迟计算,看内存(按需,执行)

3.生成器本质和其他类型一样,都是实现了迭代器协议,只不过生成器是一边计算,一边生成,从而节省内存空间,

其余的可迭代对象可没有好处。

定义生成器的前提:

1.考虑这个生成器是否需要多次遍历。

2.这个生成器内存空间的问题。

3.时间效率问题。

生成器是一个惰性的,根据惰性求值:也就是需要一个对象给一个对象

 

1.2.1生成器表达式、列表生成式、三元表达式

1.三元运算或则3元表达式

 #三元表达式格式

 res=值1  if  条件  else  值2 

 #如果条件满足 res 等于 值1  条件不满足就等于 值2
# demo 1
name = "xixi"
res = "xixi" if name == "xixi" else "hello"
print(res) #demo 2
num = 2 if False else 0
print(num)

2.列表生成式

 #列表生成式通过计算生成一个列表

 lis_gen = [ i for i in range(1,10)]  #列表生成式
print(lis_gen) lis1_gen = [i for i in range(1,10) if i%2 == 0] #生成一个偶数的列表
print(lis1_gen) lis2_gen = [ i * i for i in range(1,10) if i%2 == 1] #生成以个奇数乘自已本身奇数的列表
print(lis2_gen)

列表生成式[] demo

3.生成器表达式

 gen_exp = (i for i in range(10))  #生成器表达式
print(gen_exp) #generator
# for i in gen_exp: #取出生成器表达式的值,for循环
# print(i)
print(gen_exp.__next__()) #next方法
print(gen_exp.__next__())
print(gen_exp.__next__())
print(gen_exp.__next__())
print(gen_exp.__next__())

生成器表达式 () demo

 gen = (i for i in range(10**100))  #生成器表达式
lis = [i for i in range(10**100)] #列表生成式 #生成器,更省内存,需要一个取一个
print(gen.__next__())
print(lis) #需要在内存空间创建1-10**100序列

生成器表达式和列表生成式比较 ()和[]

总结:

1.把列表解析的[]换成()得到就是生成器表达式

2.列表生成式式一个构建一个结果列表,生成器表达式:是返回按需产生结果的一个对象

3.列表解析与生成器表达式都是一种便利的编程方式,只不过生成器表达式更节省内存

4.python不但使用迭代器协议让for循环更加通用,大部分内置函数,也是使用迭代器协议访问对象的

如,sum函数是python的内置函数,该函数使用迭代器协议访问对象,而生成器实现了迭代器协议

1.2.2生成器函数

在python中,使用了yield的函数就称为生成器(generator)

1.跟普通函数不同的是,生成器是一个返回迭代器的函数,只能用于迭代操作,可以理解为:生成器就是一个迭代器

2.在调用生成器运行过程中,每次遇到yield是函数会暂停并保存当前所有的运行信息,返回yield值。并在下一次执行next方法时,从当前位置继续运行。

普通生成器:

 >>> gen = (i for i in range(5))
>>> gen
<generator object <genexpr> at 0x0000004DE29A70A0>
>>> next(gen)
0
>>> next(gen)
1
>>> next(gen)
2
>>> next(gen)
3
>>> next(gen)
4
>>> next(gen)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
StopIteration

算法 实现生成器

注:generator保存的是算法,每次调用next方法,就计算出gen的下一个元素的值,直到计算到最后一个元素,没有更多元素时,就StopIteration的错误。

当然,上面这种不断调用next(gen),用着有点坑,正确的方法是使用for循环,因为generator也是iterator;

 >>> g = (i for i in range(5))
>>> for i in g:
... print(i)
...
0
1
2
3
4

for generator

所以我们创建了一个generator后,基本不会调用next方法,而是通过for循环来迭代它,并且不是关心StopIteration的错误。

generator非常强大,如果计算的算法比较复杂,用for循环无法实现的时候,还可以用函数来实现。

例:斐波拉契数列 后面的一个数等于前面两个数相加的和

 def fib(number):
#得出几个斐波拉契数列
count,a,b = 0,0,1
while count < number:
print(b)
a,b = b,a+b
count += 1
return "done"
fib(5)

斐波拉契数列,普通函数定义

 def fib1(number):
n,a,b = 0,0,1
while n<number:
yield b
a,b = b,a+b
n += 1
return "done"
aa = fib1(6)
print(aa) #generator
# print(aa.__next__())
for i in aa:
print(i)

斐波拉契数列,yield函数 定义

注:如果一个函数定义中包含yield关键字,那么这个函数就不是普通函数,而是一个generator

注:generator和函数执行的流程不一样,

函数是顺序执行,遇到return语句或则最后一行函数函数语句就返回。

而变成generator的函数,在每次调用next()的时候执行,遇到yield语句返回,再次执行从上次返回的yield语句处继续执行

 def packet():
for i in range(1,10):
print("开始生产包子")
yield "第 %d 屉包子" %(i)
print("卖包子,买完再生产")
cs = packet() #生成一个做包子的生成器,相当于做包子的
# print(cs)
q = print(cs.__next__()) #卖包子的
print(cs.__next__())
for i in cs:
print(i)

生产 ,卖的过程

 #单线程一边发送,一边执行
import time
def consumer(name):
print("%s 准备吃包子啦!" %name)
while True:
baozi = yield print("包子[%s]来了,被[%s]吃了!" %(baozi,name))
def producer(name):
c = consumer('A')
c2 = consumer('B')
c.__next__()
c2.__next__()
print("老子开始准备做包子啦!")
for i in range(10):
time.sleep(1)
print("做了2个包子!")
c.send(i) #发送的值,就是yield的返回值
c2.send(i)
producer("xixi")

yield生成器,单线程并发

1.2.3生成器函数总结

1.生成器函数语法上和普通函数类似:生成器使用yield语句返回一个值,而常规函数使用return语句返回一个值

2.生成器自动实现迭代器协议,迭代完,就不能再次迭代。

3.状态挂起:生成器使用yield语句返回一个值。挂起该生成器函数的状态。