RabbitMQ高可用方案总结

RabbitMQ的集群方案有以下几种：
1.普通的集群
exchange，buindling再所有的节点上都会保存一份，但是queue只会存储在其中的一个节点上，但是所有的节点都会存储一份queue的meta信息。因为这样有两个好处：
1）存储空间。如果每一个节点上都有全部的消息，有多少个节点就会有多少个消息总量的copy。加入一个队列的消息占用的空间是1G，那么三个节点就是3G
2) 性能。消息需要在节点之间传输会有很大的网络开销。如果消息设置了durable即持久化，还会增加很大的磁盘负载
队列存储的节点取决于，创建队列的客户端当时所连接的节点。如果生产者连接的是另外一个节点，将会把消息转发到存储该队列的节点上。如果消费者连接了非存储队列的节点取数据，者从存储消息的节点拉去数据。所以：
1)创建队列都连到了一个节点上，所有的队列都存储在一个节点上。
2)存消息的节点挂掉了，consumer只能等到节点恢复后才能读到消息。
3）设A,B节点，queue数据在A上：可以向A或B生产或消费消息。但是一旦往B生产消息时A挂了，client是不会收到任何错误信息的并可以继续发送，而实际上消息是被丢弃了。一旦此时client挂了后在连接B会报节点A不存在而失败。在B读也是类似的，在client批量取到的数据读完之前是不会感知A有没有挂掉，等到读取下一批数据时一旦A挂掉会报错。
所以这种集群方法的特点是：
1) 高吞吐量
2）非高可用

2.镜像模式
镜像模式和普通模式的区别就是，队列的数据都镜像了一份到所有的节点上。这样任何一个节点失效，不会影响整个集群的使用。
在实现上，mirror queue内部有一套选举算法，会选出一个master，和若干个slaver。master和slaver 通过相互间不断发送心跳来检查是否连接断开。可以通过指定net_ticktime来控制心跳检查频率。注意一个单位时间net_ticktime实际上做了4次交互，故当超过net_ticktime (± 25%) 秒没有响应的话则认为节点挂掉。另外注意修改net_ticktime时需要所有节点都一致。
配置举例：
[
        {rabbit, [{tcp_listeners, [5672]}]},
        {kernel, [{net_ticktime, 120}]}
].
consumer，任意连接一个节点，若连上的不是master，请求会转发给master，为了保证消息的可靠性，consumer回复ack给master后，master删除消息并广播所有的slaver去删除。
publisher ，任意连接一个节点，若连上的不是master，则转发给master，由master存储并转发给其他的slaver存储。
如果master挂掉，则从slaver中选择消息队列最长的为master，在这种情况下可以存在消息未同步给ack消息未同步的情况，会造成消息重发（默认是异步同步的）。总共有以下几件事情发生：

1）1个最老的（队列最长的）的slaver提升为master，如果没有一个slaver是和master同步的则会造成消息丢失。
2) 要提升为master的slaver会认为以前所有连接挂掉的master的消费者都断开了连接。那么存在clinet发送了ack的消息单还在路上是master挂掉的情况，或者master收到了ack但是在广播给slaver的时候master挂掉的情况，所以新的master别无选择，只能认为消息没有被确认。他会requeue他认为没有ack的消息。那么client可能就收到了重复的消息，并要再次发送ack。

3)从镜像队列中消费的client支持了consumer Cancellation通知的，将收到通知并订阅的mirrored-queue被取消了，这是因为该mirrored-queue 升级成了master，这是client需要重现去找mirrored-queue上消费，这样就避免了client继续发送ack到老的挂掉的master上。避免收到新的master发送的相同的消息。
4)如果noAck=true，且在mirrored-queue上消费，那么在切换时由于服务器是先ack然后发送到noAck=true的消费者，这时连接断开可能导致该数据丢失

如果slaver挂掉，则集群的节点状态没有任何变化。只要client没有连到这个节点上，也不会给client发送失败的通知。在检测到slaver挂掉的期间publish消息会有延迟。如果配置了高可用策略是自动同步，当slaver起来后，队列中有大量的消息需要同步，将会整个集群阻塞长时间的不能读写直到同步结束。
这两个挂掉的情况都需要客户端镜像容错，比如在连接断开的时候进行重连（官方的Java和.net 客户端提供了callback方法在监听到链接失败的时候调用。Java在Connection和channel类中提供了ShutdownListener 的callback方法，.net client在IConnecton中提供了ConnectionShuedown在Imodel中提供了ImodelShutdown事件供调用）。也可以在client和server之间加入LoadBalancer.比如haproxy做负载均衡。

指定mirror策略：
有三种策略：
all:队列将mirrored到所有集群中的节点中，当新节点添加进来时也会mirrored到新的节点
exactly（需指定count）:如果节点数小于count数，则队列将mirrored到所有的节点。如果节点数大于count，新的节点将不再创建队列的mirror（即使原来已创建mirror的节点挂掉也不会创建）
nodes:对指定的节点进行mirror。如果没有一个指定的节点在运行中，那么只有client连接的那个节点才会声明queue(这里有个迁移策略：假如queue是在[A,B]上且A为master，若给定的新的策略为nodes[C,D]，那么为了防止数据丢失，在迁移中会同时存在[A,C,D]直到C,D已经同步好以后，A才会关闭)
配置举例：
设置queue的名称为ha.的为高可用：
linux:rabbitmqctl set_policy ha-all "^ha\." '{"ha-mode":"all"}'
win:rabbitmqctl set_policy ha-all "^ha\." "{""ha-mode"":""all""}"
http api:PUT /api/policies/%2f/ha-all {"pattern":"^ha\.", "definition":{"ha-mode":"all"}}
web ui:
1:Navigate to Admin > Policies > Add / update a policy.
2:Enter "ha-all" next to Name, "^ha\." next to Pattern, and "ha-mode" = "all" in the first line next to Policy.
3:Click Add policy.
举例2：
rabbitmqctl set_policy ha-two "^two\." \
   '{"ha-mode":"exactly","ha-params":2,"ha-sync-mode":"automatic"}'

自动或手动同步：
你可以查看哪些slave已经同步好了：
rabbitmqctl list_queues name slave_pids synchronised_slave_pids
你可以手动同步(默认手动同步)：
rabbitmqctl sync_queue name
你可以取消自动同步：
rabbitmqctl cancel_sync_queue name
一个没有同步的mirror，它仍然会同步后续插入队列的数据，但是队列前面的数据却没有。但是随着队列的不断消费，导致空缺的部分的消息被消费掉了，此时mirror也可以是同步了的。

3.主备集群
主备方式(active,passive)只有一个节点处于服务状态，可以结合pacemaker和ARBD，
shovel简单从一个broker的一个队列中消费消息，且转发该消息到另一个broker的交换机。
这种方式用的比较少，这里就不做介绍了。详见http://www.rabbitmq.com/pacemaker.html

RabbitMQ高可用方案总结的更多相关文章

1&period;rabbitmq高可用方案
采用标准集群模式 HAPROXY + rabbitmq 2个 ram 和一个 disk 节点主机规划: 192.168.157.128 haproxy keepalive 主 ram节点 1 ...
rabbitMQ高可用方案
普通模式默认的集群模式,以两个节点(rabbit01.rabbit02)为例来进行说明.对于Queue来说,消息实体只存在于其中一个节点rabbit01(或者rabbit02),rabbit01和r ...
RabbitMQ学习系列（六）&colon; RabbitMQ 高可用集群
前面讲过一些RabbitMQ的安装和用法,也说了说RabbitMQ在一般的业务场景下如何使用.不知道的可以看我前面的博客,http://www.cnblogs.com/zhangweizhong/ca ...
Redis总结（五）缓存雪崩和缓存穿透等问题 Web API系列(三)统一异常处理 C&num;总结（一）AutoResetEvent的使用介绍（用AutoResetEvent实现同步） C&num;总结（二）事件Event 介绍总结 C&num;总结（三）DataGridView增加全选列 Web API系列(二)接口安全和参数校验 RabbitMQ学习系列（六）&colon; RabbitMQ 高可用集群
Redis总结(五)缓存雪崩和缓存穿透等问题前面讲过一些redis 缓存的使用和数据持久化.感兴趣的朋友可以看看之前的文章,http://www.cnblogs.com/zhangweizhon ...
MySQL高可用方案
高可用架构对于互联网服务基本是标配,无论是应用服务还是数据库服务都需要做到高可用.虽然互联网服务号称7*24小时不间断服务,但多多少少有一些时候服务不可用,比如某些时候网页打不开,百度不能搜索或者无法 ...
[转]MYSQL高可用方案探究(总结)
前言 http://blog.chinaunix.net/uid-20639775-id-3337432.htmlLvs+Keepalived+Mysql单点写入主主同步高可用方案 http://bl ...
Sentinel-Redis高可用方案（一）：主从复制
引言大概是因为Redis是个人开发的产品,所以Redis的高可用方案是被分成了几块来实现:主从复制.主从切换以及虚拟IP或客户端方案. 从Redis 2.8开始加入对Sentinel机制从而实现了服 ...
Redis之高可用方案
Redis之高可用方案 Redis以其高效的访问速度著称.但由于官方还未发布redis-cluster,而redis的replica又有诸多不便:比如一组master-slave的机器,如果之间有 ...
mysql高可用方案总结性说明
MySQL的各种高可用方案,大多是基于以下几种基础来部署的(也可参考:Mysql优化系列(0)--总结性梳理该文后面有提到)1)基于主从复制:2)基于Galera协议(PXC):3)基于NDB引 ...

随机推荐

STL 阅读(浅析)
写的不错,决定那这个看下.看的还是晕. http://luohongcheng.github.io/archives/
Objective-c 基础框架（初学者－总结）
一个框架其实就是一个软件包,它包含了多个类.Mac 操作系统提供了几十个框架,主要帮助开发者快速的在Mac 系统上开发应用程序.其中包括一些基础框架,就是为所有程序开发提供基础的框架,其中几个常用的类 ...
倍增法-lca codevs 1036 商务旅行
codevs 1036 商务旅行时间限制: 1 s 空间限制: 128000 KB 题目等级 : 钻石 Diamond 题目描述 Description 某首都城市的商人要经常到各城镇去做生意 ...
iOS viewController 和 view 的创建消失生命周期总结
控制器创建的生命周期 1. 如果从stroryBoard 中产生一个controller,那么会先调用initWithCoder:, awakeFromNib, loadView,viewDidLoa ...
PDF转word文档
本文未对扫描版的PDF实验,但是可编辑PDF版本可以转换为word而且转换后的word是可编辑的. 1.从http://xiazai.zol.com.cn/detail/33/326858.shtml ...
sql 两种分页offset和row&lowbar;number简单分析
新建临时表字段id,向临时表里插入1,2,3,4,5,6 if object_id('tempdb..#test') is not null drop table #test create table ...
poj2594最小顶点覆盖+传递闭包
传递闭包最开始是在Floyd-Warshall算法里面出现的,当时这算法用的很少就被我忽视了.. 传递闭包是指如果i能到达k,并且k能到达j,那么i就能到达j Have you ever read a ...
Markdown公式编辑
一.公式使用参考 1．如何插入公式行中公式(放在文中与其它文字混编)可以用如下方法表示:$ 数学公式 $ 独立公式可以用如下方法表示:$$ 数学公式 $$ 自动编号的公式可以用如下方法表示: 若需要 ...
&quot&semi;每日一道面试题&quot&semi;&period;net托管堆是否会存在内存泄漏的情况
首先说答案:会所谓的内存泄漏,就是指内存空间上产生了不再被实际使用却又无非被分配的对象.严格意义上来说,在.net中经常会遇到内存泄漏的情况,因为托管堆内的对象不再被使用时,需要等待下一次GC才会被 ...
Python--day03（变量、数据类型、运算符）
day02主要内容回顾 1.语言的分类 -- 机器语言:直接编写0,1指令,直接能被硬件执行 -- 汇编语言:编写助记符(与指令的对应关系),找到对应的指令直接交给硬件执行 -- 高级语言:编写人能识 ...