twisted的defer模式和线程池

时间:2023-01-16 21:02:08

前言:
  最近帮朋友review其模块服务代码, 使用的是python的twisted网络框架. 鉴于之前并没有使用过, 于是决定好好研究一番.
  twisted的reactor模型很好的处理了网络IO事件, 以及定时任务触发. 但包处理后的业务逻辑操作, 需要根据具体的场景来决定.
  本文将讲述twisted如何实现half-sync/half-async的模式, 其线程池和defer模式是如何设计和使用的.

场景构造:
  twisted服务接受业务请求, 后端需要访问mysql. 由于mysql的接口是同步的, 如果安装twisted默认的方式处理话, 其业务操作(mysql)会阻塞reactor的IO事件循环. 这大大降低了twisted的服务能力.
  为了解决该类问题, twisted支持线程池. 把业务逻辑和IO事件分离, IO操作依旧是异步的, 而业务逻辑则采用线程池来处理.

  twisted的defer模式和线程池

工作线程池:
  在具体讲述defer模式之前, 先谈谈reactor自带的线程池, 这也符合使用half-sync/half-async模式的直观理解.
  先来构造下一个基础样例代码:

#! /usr/bin/python
#-*- coding: UTF-8 -*- from twisted.internet import reactor
from twisted.internet import protocol
from twisted.protocols.basic import LineReceiver import time class DemoProtocol(LineReceiver): def lineReceived(self, line):
# 进行数据包的处理
reactor.callInThread(self.handle_request, line) def handle_request(self, line):
"""
hanlde_request:
进行具体的业务逻辑处理
"""
# 边使用sleep(1)来代替模拟
time.sleep(1)
# 借助callFromThread响应结果
reactor.callFromThread(self.write_response, line) def write_response(self, result):
self.transport.write("ack:" + str(result) + "\r\n") class DemoProtocolFactory(protocol.Factory):
def buildProtocol(self, addr):
return DemoProtocol() reactor.listenTCP(9090, DemoProtocolFactory())
reactor.run()

  DemoProtocol在收到一行消息, 需要处理一个业务需耗时一秒, 于是其调用callInThread来借助reactor的线程池来执行.
  其callInThread的函数定义如下:

    def callInThread(self, _callable, *args, **kwargs):
self.getThreadPool().callInThread(_callable, *args, **kwargs)

  从中, 我们可以印证之前的观点, 借助线程池来完成耗时阻塞的业务工作.
  再来看一下callFromThread的函数定义:

    def callFromThread(self, f, *args, **kw):
assert callable(f), "%s is not callable" % (f,)
self.threadCallQueue.append((f, args, kw))
self.wakeUp()

  其作用是把回调放入主线程(也是reactor主事件循环)的待执行队列中, 并及时唤醒reactor.
  我们把写入响应的操作放入主循环中, 是为了让IO集中在主循环中进行, 避免潜在的线程不安全的问题.

defer模式:
  直接使用reactor的线程池, 非常容易实现half-sync/half-async的模式, 也让IO和业务逻辑隔离. 但reactor设计之初, 更倾向于隐藏其内部的线程池. 于是其引入了defer模式.
  让我们实现与上等同的代码片段:

#! /usr/bin/python
#-*- coding: UTF-8 -*- from twisted.internet import reactor
from twisted.internet import protocol
from twisted.protocols.basic import LineReceiver
from twisted.internet.threads import deferToThread import time class DemoProtocol(LineReceiver): def lineReceived(self, line):
# 进行数据包的处理
deferToThread(self.handle_request, line).addCallback(self.write_response) def handle_request(self, line):
"""
hanlde_request:
进行具体的业务逻辑处理
"""
# 边使用sleep(1)来代替模拟
time.sleep(1)
return line def write_response(self, result):
self.transport.write("ack:" + str(result) + "\r\n") class DemoProtocolFactory(protocol.Factory):
def buildProtocol(self, addr):
return DemoProtocol() reactor.listenTCP(9090, DemoProtocolFactory())
reactor.run()

  使用defer后, 代码更加的简洁. 其defer对象, 其实借用了线程池.
  threads.deferToThread定义如下:

def deferToThread(f, *args, **kwargs):
from twisted.internet import reactor
return deferToThreadPool(reactor, reactor.getThreadPool(),
f, *args, **kwargs) def deferToThreadPool(reactor, threadpool, f, *args, **kwargs):
d = defer.Deferred() def onResult(success, result):
if success:
reactor.callFromThread(d.callback, result)
else:
reactor.callFromThread(d.errback, result) threadpool.callInThreadWithCallback(onResult, f, *args, **kwargs) return d

  这边我们可以发现deferToThread, 就是间接调用了callInThread函数, 另一方面, 对其回调函数的执行结果, 进行了onCallback, 以及onErrback的调用. 这些回调函数在主线程中运行.
  defer模式简化了程序编写, 也改变了人们开发的思维模式.

测试回顾:
  使用telnet进行测试, 结果正常.
  twisted的defer模式和线程池
  另一方面, twisted的线程池, 其默认是采用延迟初始化的方式.
  服务开启时, 只有主线程一个, 随着请求的到来, 其按需产生更多的worker thread.
  而其线程池默认为10. 我们可以借助suggestThreadPoolSize方法来修改.

写在最后:
  
如果你觉得这篇文章对你有帮助, 请小小打赏下. 其实我想试试, 看看写博客能否给自己带来一点小小的收益. 无论多少, 都是对楼主一种由衷的肯定.

  twisted的defer模式和线程池