【原版的】Redis事件驱动内核

时间:2021-12-09 23:21:30

Redis事件驱动内核

作者:cf (360电商技术组)

概述

Redis实现了自己的事件驱动,与开源事件库libevent、libev一样,都是基于I/O多路复用技术实现的。出于性能和代码精炼双方面考虑。redis未像memcache一样使用libevent或libev成熟的事件库(libevent/libev为了其通用性增加了非常多扩展功能减少了使用它的性能,且代码量相比redis来说是大非常多的)。

它主要支持了epoll、select、kqueue、以及基于Solaris的event ports。主要提供了对两种类型的事件驱动:

1、I/O事件,包含读事件和写事件。

2、定时器事件。包含一次性定时器和循环定时器。

源代码分析

主要文件有:ae.c  ae.h  ae_epoll.c  ae_evport.c  ae_kqueue.c  ae_select.c, 当中ae.c是事件处理模块主体,ae_epoll.c  ae_kqueue.c  ae_select.c  ae_evport.c是事件处理的四种实现方式。分别相应了epoll、select、kqueue、event ports,提供了同样的接口。

#ifdef HAVE_EVPORT

#include "ae_evport.c"

#else

#ifdef HAVE_EPOLL

#include "ae_epoll.c"

#else

#ifdef HAVE_KQUEUE

#include "ae_kqueue.c"

#else

#include "ae_select.c"

#endif

#endif

#endif

ae.c分析

redis的ae事件驱动库主要逻辑在ae.c中,当中依据使用的系统事件接口分别选择include ae_epoll.c或其它的文件。用到的主要数据结构在ae.h中定义。

主要数据结构创建:

aeCreateEventLoop

首先创建一个aeCreateEventLoop对象。

该对象须要一个最大文件描写叙述符作为參数setSize,这个參数的意义须要了解ae的数据存放结构。在aeEventLoop结构中有两个数组(server程序惯用提前分配好内存然后用index映射到相应位置的做法)。这两个数组的大小就是这里的參数值。

ae会创建一个 setSize*sizeof(aeFileEvent) 以及一个 setSize*siezeof(aeFiredEvent) 大小的内存,用文件描写叙述符作为其索引,能够达到O(1)的速度找到事件数据所在位置。

准备系统提供的事件模型接口,以epoll为例。

ae提供了一个统一的结构名aeApiState

在包装epoll的aeApiState中有一个epfd表示epoll占用的fd,一个epoll_event *events。事实上也是一个aeApiState数组,和aeFiredEvent相应,当epoll_wait()返回时,会将pending的文件描写叙述符的信息放在aeFiredEvent数组中。包含fd和mask事件类型。此时的aeFiredEvent不是以fd作为下标的。而是把这个数组当成一个缓冲区。存放epoll_wait()返回的全部fd,同一时候用epoll_event数组存放epoll_wait()返回的epoll_data数据,用其数据能够填充aeFiredEvent数组的内容供ae使用找到pending的aeFileEvent对象,并在下一次进入epoll_wait()前处理完。这样完毕了对epoll数据封装。

typedef struct aeApiState {

int epfd;

struct epoll_event *events;

} aeApiState;

aeCreateFileEvent

创建I/O事件时须要指定要注冊的文件的文件描写叙述符fd,以及要监听的事件类型mask。

ae先通过fd找到其相应的aeCreateFileEvent对象所在内存位置。

typedef struct aeFileEvent {

int mask; /* one of AE_(READABLE|WRITABLE) */

aeFileProc *rfileProc;

aeFileProc *wfileProc;

void *clientData;

} aeFileEvent;

增加要监听的事件类型mask fe->mask |= mask,接着依据要监听的类型增加读事件或者写事件的回调函数。即aeFileProc。并更新maxfd以备后用。在创建文件事件的过程中还要通过宏推断后include进来的底层事件模型接口来注冊I/O事件。以epoll为例,通过aeApiAddEvent将文件描写叙述符fd和事件类型mask传给epoll操作。首先通过fd为下标找到aeCreateFileEvent相应的位置,然后取得epoll的epfd。

通过EPOLL_CTL_ADDEPOLL_CTL_MOD来增加或者改动epoll在该fd上事件的类型。

aeCreateTimeEvent

ae的定时器是用一个单链表来管理的,将定时器依次从head插入到单链表中。插入的过程中会取得未来的墙上时间作为其超时的时刻。

即将当前时间加上增加定时器时给定的延迟时间。

定时器结构例如以下。并设置超时以及注销定时器时的回调函数还用clientData。

typedef struct aeTimeEvent {

long long id; /* time event identifier. */

long when_sec; /* seconds */

long when_ms; /* milliseconds */

aeTimeProc *timeProc;

aeEventFinalizerProc *finalizerProc;

void *clientData;

struct aeTimeEvent *next;

} aeTimeEvent;

事件循环:

aeMain入口函数

ae事件循环的基本结构是一个无限循环,在循环中去检測各个事件的发生。

当然这里不是全然意义上的轮询,由于循环里面封装了epoll,select等事件驱动机制。

while (!eventLoop->stop) {

if (eventLoop->beforesleep != NULL)

eventLoop->beforesleep(eventLoop);

aeProcessEvents(eventLoop, AE_ALL_EVENTS);

}

beforesleep是进入一次循环之前做的操作。

aeProcessEvents

ae中最基本的逻辑就是事件处理。aeProcessEvents是处理事件的入口。

在进入事件处理函数时,若没有不论什么事件则马上返回。

if (!(flags & AE_TIME_EVENTS) && !(flags & AE_FILE_EVENTS)) return 0;

然后推断是否有定时器事件,假设有就去取得近期的一个将超时定时器的时间减去当前时间作为epoll或者select等事件接口的超时时间。该寻找过程是通过遍历单链表得到的。

这样指定超时时间,在有I/O事件pending时能够处理I/O事件,若没有则能够保证从epoll或者select中返回去处理定时器事件。也能够不注冊定时器事件然后将事件的flags|AE_DONT_WAIT,那么就会在poll中一直等待I/O时间的到来。

在获得事件接口超时时间后。调用封装事件接口的函数aeApiPoll。以epoll为例,首先获得apidata,然后从中获得epoll的文件描写叙述符epfd,并用events指针指向的数组内存以及超时时间调用epoll的epoll_wait().epoll()返回时会将结果放在epoll_event数组中同一时候返回新的文件描写叙述符。

通过对返回数据的事件类型做推断能够填充到aeFiredEvent中fd和事件类型信息。

返回到ae的逻辑中,通过遍历aeFiredEvent数组取得fd能够找到pending事件的aeFileEvent,然后依据事件的类型去调用用户定义的I/O回调函数。

当epoll或者select超时返回时并注冊了定时器事件时,通过processTimeEvents处理超时事件

if (now < eventLoop->lastTime) {

te = eventLoop->timeEventHead;

while(te) {

te->when_sec = 0;

te = te->next;

}

}

这么做的意义,事实上就是假设系统事件变更了。就将全部的定时器时间设为0,让他在本次循环中超时并被运行

当一个定时器被处理的时候,可能会增加新的定时,比方在定时器处理函数中增加新的定时器。此时仅应该处理上一个时间段的状态,不应该在本次循环中去处理新的定时器。因此ae在EventLoop中增加了一个timeEventNextId的成员表示此次循环中最大的定时器id+1,这样在遍历定时器列表时,先保存最大的定时器id。然后遍历过程过滤掉定时器列表可能增加新的定时器就可以

if (te->id > maxId) {

te = te->next;

continue;

}

这里定时器的逻辑是若单链表中的定时器时间比当前时间晚就运行定时器注冊的回调函数。假设该回调函数返回正值,那么就更新定时器时间为该值之后,从而能够循环运行定时器。

假设该回调函数返回AE_NOMORE。那么在运行完回调函数后注销该定时器。

清理工作

注销I/O事件

注销I/O事件不是以aeFileEvent为单位而是该I/O事件加上其监听的事件类型为对象,因此其接口为aeDeleteFileEvent(aeEventLoop *eventLoop, int fd, int mask)。首先通过fd找到去掉aeFileEvent对象。然后获得已有的mask,对其进行减操作后。构成fd上新的mask事件类型。通过改动epoll或者select中注冊的I/O事件来完毕。以epoll为例。会依据该文件描写叙述符上是否还有待等待的事件类型分别调用epoll_ctrEPOLL_CTL_MOD或者EPOLL_CTL_DEL命令。

注销Timer时间

注销定时器事件的操作比較暴力,直接遍历链表。找到定时器id匹配的项,使用单链表删除操作进行删除。这里再删除之前会调用定时器上的finalizerProc。

注销aeEventLooop

注销aeEventLooop就是释放相关内存。

总结

感觉ae比較直观,主要提供了一个I/O事件和定时器事件的事件驱动模型。定时器的单链表逻辑能够再改进。比方用最小堆或者时间轮(Timing-Wheel)等定时器解决方法。

-------------------------------------------------------------------------------------

黑夜路人。一个关注开源技术、乐于学习、喜欢分享的程序猿

博客:http://blog.csdn.net/heiyeshuwu

微博:http://weibo.com/heiyeluren

微信:heiyeluren2012

想获取很多其它IT开源技术相关信息,欢迎关注微信!

微信二维码扫描高速关注本号码:

【原版的】Redis事件驱动内核

tp=webp" style="max-width: 100%; height: auto !important; word-wrap: break-word !important; box-sizing: border-box !important; width: auto !important; visibility: visible !important;" alt="" />

Redis内核之事件驱动

作者:cf (360电商技术组)

概述

Redis实现了自己的事件驱动。与开源事件库libevent、libev一样。都是基于I/O多路复用技术实现的。

出于性能和代码精炼双方面考虑,redis未像memcache一样使用libevent或libev成熟的事件库(libevent/libev为了其通用性增加了非常多扩展功能减少了使用它的性能,且代码量相比redis来说是大非常多的)。

它主要支持了epoll、select、kqueue、以及基于Solaris的event ports。主要提供了对两种类型的事件驱动:

1、I/O事件,包含读事件和写事件。

2、定时器事件。包含一次性定时器和循环定时器。

源代码分析

主要文件有:ae.c  ae.h  ae_epoll.c  ae_evport.c  ae_kqueue.c  ae_select.c, 当中ae.c是事件处理模块主体。ae_epoll.c  ae_kqueue.c  ae_select.c  ae_evport.c是事件处理的四种实现方式,分别相应了epoll、select、kqueue、event ports,提供了同样的接口。

#ifdef HAVE_EVPORT

#include "ae_evport.c"

#else

#ifdef HAVE_EPOLL

#include "ae_epoll.c"

#else

#ifdef HAVE_KQUEUE

#include "ae_kqueue.c"

#else

#include "ae_select.c"

#endif

#endif

#endif

ae.c分析

redis的ae事件驱动库主要逻辑在ae.c中,当中依据使用的系统事件接口分别选择include ae_epoll.c或其它的文件。用到的主要数据结构在ae.h中定义。

主要数据结构创建:

aeCreateEventLoop

首先创建一个aeCreateEventLoop对象。

该对象须要一个最大文件描写叙述符作为參数setSize。这个參数的意义须要了解ae的数据存放结构。

在aeEventLoop结构中有两个数组(server程序惯用提前分配好内存然后用index映射到相应位置的做法),这两个数组的大小就是这里的參数值。

ae会创建一个 setSize*sizeof(aeFileEvent) 以及一个 setSize*siezeof(aeFiredEvent) 大小的内存,用文件描写叙述符作为其索引。能够达到O(1)的速度找到事件数据所在位置。

准备系统提供的事件模型接口,以epoll为例。ae提供了一个统一的结构名aeApiState。在包装epoll的aeApiState中有一个epfd表示epoll占用的fd,一个epoll_event *events,事实上也是一个aeApiState数组,和aeFiredEvent相应。当epoll_wait()返回时,会将pending的文件描写叙述符的信息放在aeFiredEvent数组中,包含fd和mask事件类型。此时的aeFiredEvent不是以fd作为下标的。而是把这个数组当成一个缓冲区,存放epoll_wait()返回的全部fd,同一时候用epoll_event数组存放epoll_wait()返回的epoll_data数据,用其数据能够填充aeFiredEvent数组的内容供ae使用找到pending的aeFileEvent对象,并在下一次进入epoll_wait()前处理完。

这样完毕了对epoll数据封装。

typedef struct aeApiState {

int epfd;

struct epoll_event *events;

} aeApiState;

aeCreateFileEvent

创建I/O事件时须要指定要注冊的文件的文件描写叙述符fd,以及要监听的事件类型mask。ae先通过fd找到其相应的aeCreateFileEvent对象所在内存位置。

typedef struct aeFileEvent {

int mask; /* one of AE_(READABLE|WRITABLE) */

aeFileProc *rfileProc;

aeFileProc *wfileProc;

void *clientData;

} aeFileEvent;

增加要监听的事件类型mask fe->mask |= mask,接着依据要监听的类型增加读事件或者写事件的回调函数。即aeFileProc,并更新maxfd以备后用。

在创建文件事件的过程中还要通过宏推断后include进来的底层事件模型接口来注冊I/O事件。以epoll为例。通过aeApiAddEvent将文件描写叙述符fd和事件类型mask传给epoll操作。首先通过fd为下标找到aeCreateFileEvent相应的位置,然后取得epoll的epfd。通过EPOLL_CTL_ADD和EPOLL_CTL_MOD来增加或者改动epoll在该fd上事件的类型。

aeCreateTimeEvent

ae的定时器是用一个单链表来管理的,将定时器依次从head插入到单链表中。

插入的过程中会取得未来的墙上时间作为其超时的时刻。

即将当前时间加上增加定时器时给定的延迟时间。定时器结构例如以下。并设置超时以及注销定时器时的回调函数还用clientData。

typedef struct aeTimeEvent {

long long id; /* time event identifier. */

long when_sec; /* seconds */

long when_ms; /* milliseconds */

aeTimeProc *timeProc;

aeEventFinalizerProc *finalizerProc;

void *clientData;

struct aeTimeEvent *next;

} aeTimeEvent;

事件循环:

aeMain入口函数

ae事件循环的基本结构是一个无限循环,在循环中去检測各个事件的发生。当然这里不是全然意义上的轮询,由于循环里面封装了epoll,select等事件驱动机制。

while (!eventLoop->stop) {

if (eventLoop->beforesleep != NULL)

eventLoop->beforesleep(eventLoop);

aeProcessEvents(eventLoop, AE_ALL_EVENTS);

}

beforesleep是进入一次循环之前做的操作。

aeProcessEvents

ae中最基本的逻辑就是事件处理。

aeProcessEvents是处理事件的入口。在进入事件处理函数时。若没有不论什么事件则马上返回。

if (!(flags & AE_TIME_EVENTS) && !(flags & AE_FILE_EVENTS)) return 0;

然后推断是否有定时器事件,假设有就去取得近期的一个将超时定时器的时间减去当前时间作为epoll或者select等事件接口的超时时间。该寻找过程是通过遍历单链表得到的。这样指定超时时间,在有I/O事件pending时能够处理I/O事件,若没有则能够保证从epoll或者select中返回去处理定时器事件。也能够不注冊定时器事件然后将事件的flags|AE_DONT_WAIT,那么就会在poll中一直等待I/O时间的到来。

在获得事件接口超时时间后。调用封装事件接口的函数aeApiPoll。

以epoll为例,首先获得apidata。然后从中获得epoll的文件描写叙述符epfd,并用events指针指向的数组内存以及超时时间调用epoll的epoll_wait().epoll()返回时会将结果放在epoll_event数组中同一时候返回新的文件描写叙述符。通过对返回数据的事件类型做推断能够填充到aeFiredEvent中fd和事件类型信息。

返回到ae的逻辑中,通过遍历aeFiredEvent数组取得fd能够找到pending事件的aeFileEvent,然后依据事件的类型去调用用户定义的I/O回调函数。

当epoll或者select超时返回时并注冊了定时器事件时,通过processTimeEvents处理超时事件

if (now < eventLoop->lastTime) {

te = eventLoop->timeEventHead;

while(te) {

te->when_sec = 0;

te = te->next;

}

}

这么做的意义,事实上就是假设系统事件变更了,就将全部的定时器时间设为0,让他在本次循环中超时并被运行

当一个定时器被处理的时候。可能会增加新的定时,比方在定时器处理函数中增加新的定时器。此时仅应该处理上一个时间段的状态,不应该在本次循环中去处理新的定时器。因此ae在EventLoop中增加了一个timeEventNextId的成员表示此次循环中最大的定时器id+1,这样在遍历定时器列表时。先保存最大的定时器id,然后遍历过程过滤掉定时器列表可能增加新的定时器就可以

if (te->id > maxId) {

te = te->next;

continue;

}

这里定时器的逻辑是若单链表中的定时器时间比当前时间晚就运行定时器注冊的回调函数。假设该回调函数返回正值,那么就更新定时器时间为该值之后,从而能够循环运行定时器。假设该回调函数返回AE_NOMORE,那么在运行完回调函数后注销该定时器。

清理工作

注销I/O事件

注销I/O事件不是以aeFileEvent为单位而是该I/O事件加上其监听的事件类型为对象,因此其接口为aeDeleteFileEvent(aeEventLoop *eventLoop, int fd, int mask)。

首先通过fd找到去掉aeFileEvent对象。然后获得已有的mask,对其进行减操作后,构成fd上新的mask事件类型。通过改动epoll或者select中注冊的I/O事件来完毕。以epoll为例,会依据该文件描写叙述符上是否还有待等待的事件类型分别调用epoll_ctr的EPOLL_CTL_MOD或者EPOLL_CTL_DEL命令。

注销Timer时间

注销定时器事件的操作比較暴力。直接遍历链表,找到定时器id匹配的项,使用单链表删除操作进行删除。这里再删除之前会调用定时器上的finalizerProc。

注销aeEventLooop

注销aeEventLooop就是释放相关内存。

总结

感觉ae比較直观,主要提供了一个I/O事件和定时器事件的事件驱动模型。

定时器的单链表逻辑能够再改进。比方用最小堆或者时间轮(Timing-Wheel)等定时器解决方法。

-------------------------------------------------------------------------------------

黑夜路人,一个关注开源技术、乐于学习、喜欢分享的程序猿

博客:http://blog.csdn.net/heiyeshuwu

微博:http://weibo.com/heiyeluren

微信:heiyeluren2012

想获取很多其它IT开源技术相关信息,欢迎关注微信!

微信二维码扫描高速关注本号码:

【原版的】Redis事件驱动内核

tp=webp" _src="//bbsmax.ikafan.com/static/L3Byb3h5L2h0dHAvbW1iaXoucXBpYy5jbi9tbWJpei93RlRETUg2ZjAxSHJKaWJFZ1dMdldyaDNGUlU4dmlhd0JRQTdjeUpjb25INWxaR0ZpY2lhamJSd1Z4WnM0eUtEM0xnU3poSFEyNU01MUhzcXdqTng2c29NbXcvNjQwP3RwPXdlYnA=.jpg" style="max-width: 100%; height: auto !important; word-wrap: break-word !important; box-sizing: border-box !important; width: auto !important; visibility: visible !important;" alt="" />

版权声明:本文博客原创文章。博客,未经同意,不得转载。

【原版的】Redis事件驱动内核的更多相关文章

  1. 深入剖析 redis 事件驱动

    概述 redis 内部有一个小型的事件驱动,它和 libevent 网络库的事件驱动一样,都是依托 I/O 多路复用技术支撑起来的. 利用 I/O 多路复用技术,监听感兴趣的文件 I/O 事件,例如读 ...

  2. Redis 机器内核参数优化

    " > /proc/sys/vm/overcommit_memory echo never > /sys/kernel/mm/transparent_hugepage/enabl ...

  3. redis 文件事件模型

    参考文献: 深入剖析 redis 事件驱动 Redis 中的事件循环 深入了解epoll (转) Redis自己的事件模型 ae EPOLL(7) Linux IO模式及 select.poll.ep ...

  4. Redis资料汇总专题

    1.Redis是什么? 十五分钟介绍 Redis数据结构 Redis系统性介绍 一个很棒的Redis介绍PPT 强烈推荐!非同一般的Redis介绍 Redis之七种武器 锋利的Redis redis ...

  5. redis资料汇总

    redis资源比较零散,引用nosqlfan上的文章,方便大家需要时翻阅.大家看完所有的,如果整理出文章的,麻烦知会一下,方便学习. 1.Redis是什么? 十五分钟介绍 Redis数据结构 Redi ...

  6. Cloud Insight 仪表盘上线 &vert; 全面监控 Redis

    OneAPM 作为应用性能领域的新兴领军企业,近期发布了重量级新产品-- Cloud Insight 数据管理平台,用它能够监控所有基础组件,并通过 tag 标签对数据进行管理. 近日,Cloud I ...

  7. 高性能linux服务器内核调优

    高性能linux服务器内核调优 首先,介绍一下两个命令1.dmesg 打印系统信息.有很多同学们服务器出现问题,看了程序日志,发现没啥有用信息,还是毫无解决头绪,这时候,你就需要查看系统内核抛出的异常 ...

  8. &lbrack;转载&rsqb; Redis资料汇总专题

    转载自http://www.cnblogs.com/tommyli/archive/2011/12/14/2287614.html 1.Redis是什么? 十五分钟介绍 Redis数据结构 Redis ...

  9. 如何监控Redis性能指标(译)

    Redis给人的印象是简单.很快,但是不代表它不需要关注它的性能指标,此文简单地介绍了一部分Redis性能指标.翻译过程中加入了自己延伸的一些疑问信息,仍然还有一些东西没有完全弄明白.原文中Metri ...

随机推荐

  1. HDU 1512 Monkey King

    左偏树.我是ziliuziliu,我是最强的 #include<iostream> #include<cstdio> #include<cstring> #incl ...

  2. POJ1260Pearls

    http://poj.org/problem?id=1260 题意 :这个题大概是讲,给你几种等级不同的珠宝,然后告诉你它的数量和价值,等级是升序排列的,且随等级的升高价值也随之升高,但为了防止有的客 ...

  3. IDEA插件开发基础

    由于简易ORM的需要,想要做一些代码自动生成功能(通过右键菜单辅助) 半自动编写代码,故考虑需要开发IDE插件(我司现使用IDEA) 1.例子代码http://confluence.jetbrains ...

  4. Objective-C时间戳转换的转换和时间

    什么是时间戳? 时间戳(timestamp),一般是一个字符序列.唯一地标识某一刻的时间.数字时间戳技术是数字签名技术一种变种的应用. 思考:简单来讲就是依据文件hash加密后生成的摘要和时间生成的时 ...

  5. Terracotta收购Ehcache (转)

    随着Terracotta对Ehcache的收购成行,业界两大知名的开源Java缓存产品走到了一起.以提供JVM级“POJO集群”而闻名于世的Terracotta可以将运行在单个JVM上的多线程应用移植 ...

  6. 80x86汇编小站站长简单介绍-2014年08月23日

    [序言] 旧版的"80x86汇编小站站长简单介绍"已经过时了, 因此于2013年10月01日花费1个小时又一次更新和排版一次. [人生格言]  1] 一生都用头脑而不是情绪解决这个 ...

  7. Python3&plus;Selenium获取session和token供Requests使用教程

    一.背景说明 之前写了一款简单的api模糊测试工具,之前系统可以使用http Base认证现在改成session形式并加上了token. 最简单的改造方法,是自己先在浏览器手动登录,然后提取出sess ...

  8. 一篇 JPA 总结

    概述 下面是 JDBC 在 Java 应用和数据库之间的位置,充当着一个中间者,供 Java 应用程序访问所有类别的数据库,建立一个标准 JPA 如同 JDBC 一样,为 Java 应用程序使用 OR ...

  9. php markdown 接口文档生成工具 SummerDoc

    2017年9月18日 19:20:22 星期一 因工作需要, 用PHP写了一个管理接口文档的小工具, 下边介绍一下: 浏览器展示的效果: 项目地址:(码云) 例子(http://doc.hearu.t ...

  10. 作为一个有B格的前端工程师需要掌握的一些知识

    如果说你3年还在不停地切页面的... 那么你对http协议的了解程度 你的原生的javascript的掌握程度 你的页面的优化的理念 你在写页面是否会有什么独特地技巧 你对ajax的get和post方 ...