Python协程笔记 - yield

时间:2021-05-21 23:35:32

生成器(yield)作为协程

yield实际上是生成器,在python 2.5中,为生成器增加了.send(value)方法。这样调用者可以使用send方法对生成器发送数据,发送的数据在生成器中会赋值给yield左侧的变量(如果有的话),可以生成器可以作为协程使用。

下面是一个使用生成器实现的,求平均值的函数

def averager1():
    """
    使用yield接收数值,并求平均值
    :return:
    """
    count = 0
    total = 0.0
    average = 0.0
    while True:
        value = yield average
        count += 1
        total += value
        average = total/count


avg1 = averager1()
# 预激活协程,程序执行到yield出暂停,产出average,输出0.0
print(next(avg1))
# 0.00
# 向协程发送数字
print(avg1.send(10))
# 10.0
print(avg1.send(20))
# 15.0
print(avg1.send(30))
# 20.0

这里yield可以理解为连接调用者和生成器的运输小车,只不过运输的不是货物,而是数据。预激活生成器时,相当于调用者打电话给生成器,让他把小车开到调用者这里等待接收货物(代码执行到yield处暂停),这个时候,如果生成器有什么货物(数据)需要运输给调用者,那么可以顺带把货物捎带过去(yield average 产出值),当然也有可能是空车驶到调用者这里(yield右侧没有产出任何变量)。

接着,调用者需要将货物(数据)运输给生成器,那么就是重新让小车把货物运送给生成器(调用生成器的.send()方法)。生成器接收到yield小车运输过来的货物之后(value = yield),总之可以开始生产、销售或者其他事情(求平均值)。当生成器这些事情都做完后,又重新将小车开回到调用者这一方,并暂停,等待接收调用者的下一个指令,如此往返。

逐行解读上一个例子的代码

首先,调用生成器函数,创建一个生成器对象avg。然后对生成器对象进行预激活,这里的预激活指的是让生成器对象执行到yield除,然后会暂停。因为生成器对象只有在yield除暂停时,才能接收到调用者通过send方法发送给生成器的值,所以没有进行预激活的生成器对象无法正常工作。

我们知道,python的赋值语句,是从右向左执行的,所以在这里例子中,yield average会先执行,将average产出。

这个时候程序的控制器转交给调用者,继续执行print语句,所以print(next(avg))会输出yield产出的值,即average,输出0.00。

生成器的调用者继续往下执行,调用生成器的send方法,将10发送给生成器对象。开头说过,调用生成器对象的send方法,发送的数据,会赋值给yield左边的变量。在这个例子中,value = yield average, 暂时先把yield右侧的average忽略掉,只看value = yield,可以理解为,将yield获取到了调用者通过send方法发送给生成器的值,然后把这个值赋值给左侧的变量value,接着是简单的计算平均值,这样就实现了调用者给生成器对象发送数据。

注意生成器内部有个while的无限循环,生成器内部的代码会继续执行,直到再次遇到yield,程序暂停,再次把average的值产出,并将程序的控制器再次转交回调用者。

这个时候调用者继续执行print语句,输出average的值:10.0。后面的几次send也是一样的效果。

终止生成器对象的循环

之前的例子,while True会导致生成器对象无限循环,每次都会在yield除暂停,产出平均值average,并等待接收调用者再次通过send方法传入的新值。

如果需要终止生成器对象的无限循环,可以用三种方式:

  • 发送哨符终止循环

  • 调用生成器的.throw()方法终止循环

  • 调用生成器的.close()方法终止循环

发送哨符终止循环

从最简单的发送哨符终止循环开始,简单的说,就是发送一个特定的值给生成器对象,当生成器获取到这个值时,就通过break语句退出while循环。

def averager2():
    """
    使用yield接收数值,并求平均值
    相对于上面的例子,增加了使协程退出的哨符
    :return:
    """
    count = 0
    total = 0.0
    average = 0.0
    while True:
        value = yield average
        # 当value为None时,退出循环
        if value is None:
            break
        count += 1
        total += value
        average = total/count

avg2 = averager2()
# 预激活协程,因为yield右边没有变量,所以不会产出值
print(next(avg2))
# 0.0
# 向协程发送数字
print(avg2.send(10))
# 10.0
print(avg2.send(20))
# 15.0
print(avg2.send(30))
# 20.0
# 生成器循环终止时会抛出StopIteration
# 所以做一个异常捕获
try:
    avg2.send(None)
except StopIteration:
    pass

上面的生成器函数,做了一个简单的判断,当value为None时,就执行break语句退出生成器对象的循环。生成器循环终止时会抛出StopIteration,这个也会作为后面生成器返回值的途径。

调用.throw()方法终止循环

调用生成器的.throw()方法,会将异常发送给生成器,生成器的处理规则如下:

  1. 生成器在yield处暂停时,会接收到throw方法传入的异常

  2. 如果生成器能正确处理传入的异常,那么生成器的代码会继续执行,yield产出右侧的值(如果右侧有值的话),并作为调用者调用生成器.throw()方法的返回值

  3. 如果生成器不能处理传入的异常,那么生成器的代码会中止运行,并将异常向上冒泡,再次发给调用者

看一个例子

# 对第一个函数averager1进行修改,增加处理ValueError的代码
def averager3():
    """
    使用yield接收数值,并求平均值
    对第一个函数averager3进行修改,增加处理ValueError的代码
    :return:
    """
    count = 0
    total = 0.0
    average = 0.0
    while True:
        try:
            value = yield average
            count += 1
            total += value
            average = total/count
        except ValueError:
            # 如果捕获到ValueError,什么都不做
            # 这样生成器会继续循环,直到再次遇到yield暂停
            pass


avg3 = averager3()
next(avg3)
print(avg3.send(10))
# 10.0
print(avg3.send(20))
# 15.0
# throw一个生成器可以处理的异常ValueError,没有任何影响
# 生成器会继续运行,产出average,因为在yield处就报错,后续的代码没有执行
# 所以average仍然为15.0
# yield会将average产出,产出的值作为调用者执行生成器的throw方法的返回值,最终输出15.0
print(avg3.throw(ValueError))
# 15.0
# throw一个生成器不能处理的异常,生成器循环终止
try:
    print(avg3.throw(TypeError))
except TypeError:
    print('生成器无法处理TypeError,异常向上冒泡抛出,循环终止')

调用.close()方法终止循环

close()方法,实际上是让生成器在yield出抛出GeneratorExit异常。

不过和直接.throw(GeneratorExit)不同的是,通过close让生成器抛出GeneratorExit后,生成器不能再产出任何值,否则会引发RuntimeError: generator ignored GeneratorExit。

# 对第三个函数averager3进行修改,改为捕获GeneratorExit异常并忽略
def averager4():
    """
    使用yield接收数值,并求平均值
    对第三个函数averager3进行修改,改为捕获GeneratorExit异常并忽略
    :return:
    """
    count = 0
    total = 0.0
    average = 0.0
    while True:
        try:
            value = yield average
            count += 1
            total += value
            average = total/count
        except GeneratorExit:
            # 如果捕获到GeneratorExit,什么都不做
            # 这样生成器会继续循环,直到再次遇到yield
            # 因为调用close后不允许再次yield,所以会抛出
            # RuntimeError: generator ignored GeneratorExit
            pass
avg4 = averager4()
next(avg4)
print(avg4.send(10))
print(avg4.send(20))
avg4.close()
# RuntimeError: generator ignored GeneratorExit

如果是直接.throw(GeneratorExit),那么遵循上述的规范,如果生成器处理了这个异常,循环继续;如果生成器无法的处理这个异常,循环终止。

通常情况下,生成器不应该捕获这个异常,或者捕获这个异常后应抛出StopItreation异常,否则调用方会报错。

协程返回值

协程是通过抛出StopIteration来返回值,StopIteration第一个值就是异常的返回值。

def averager5():
    """
    使用yield接收数值,并求平均值
    修改averager2,每次yield不再产出平均数
    而是改为协程结束后再返回
    :return:
    """
    count = 0
    total = 0.0
    average = 0.0
    while True:
        value = yield
        # 当value为None时,退出循环
        if value is None:
            break
        count += 1
        total += value
        average = total/count
    return average

avg5 = averager5()
next(avg5)
avg5.send(10)
avg5.send(20)
try:
    # 发送None,结束协程,同时捕获StopIteration异常
    avg5.send(None)
except StopIteration as ex:
    print(ex)
    # 15

 

注:

《流畅的Python》学习笔记,部分例子来自书中,并有一些修改,便于验证某些结论。