MySQL高可用方案-MySQL InnoDB Cluster

时间:2023-03-09 03:44:27
MySQL高可用方案-MySQL InnoDB Cluster

MySQL InnoDB Cluster简介

MySQL InnoDB Cluster 是最新GA的MySQL高可用方案,利用MySQL Group Replication和MySQL Shell、MySQL Router可以轻松搭建强壮的高可用方案。

MySQL InnoDB Cluster的特性:他是基于群组复制并且提供便于管理的 API以及应用故障转移和路由,易于配置,提供比群组复制更高级别的可用性。

MySQL InnoDB Cluster组件构成:

MySQL Group Replication:提供 DB 的扩展、自动故障转移

MySQL Router:是访问路由转发中间件,提供应用程序访问的failover能力

MySQL Shell:是新的mysql 客户端工具支持x protocol和mysql protocol,具备JavaScript和python可编程能力,作为搭建InnoDB Cluster管理工具

X DevAPI:一个 API 通过 XProtocol 与服务器通信

Admin API:一个特殊的API通过 MySQL Shell 使用,可以用于对 Innodb Cluster 进行配置管理

MySQL高可用方案-MySQL InnoDB Cluster

整体架构:

MySQL高可用方案-MySQL InnoDB Cluster

上图显示了 InnoDB Cluster 的整体架构,通过MySQL Shell可以配置出一个高可用自动进行故障转移的MySQL InnoDB Cluster,在后续运维过程中也可以通过MySQL Shell对集群进行状态监控及管理维护,通过MySQL Router向应用层屏蔽底层集群的细节(MySQL Router 推荐部署在应用端),使用 MySQL Enterprise Monitor 对整体进行监控。

MySQL Group Replication:

MGR通信服务基于 Paxos 实现,为 MySQL 5.7 之后的版本提供同步复制(日志复制同步,数据施放异步),并且支持所有的 MySQL 平台,MGR 提供了高可用分布式 MySQL 数据库服务,它可以实现服务器自动故障转移,分布式容错能力,支持多主更新的架构,自动重配置(加入/移除节点,崩溃等等)并且可以自动侦测和处理冲突。

MGR特性:

(1)支持单主和多主模式

(2)基于Paxos算法,实现数据复制的一致性

(3)插件化设计,支持插件检测,新增节点小于集群当前节点主版本号,拒绝加入集群,大于则加入,但无法作为主节点

(4)没有第三方组件依赖

(5)支持全链路SSL通讯

(6)支持IP白名单

(7)不依赖网络多播

适用场景:

弹性复制,服务器的数量动态增加或缩减时,使影响降到最低。

分片的高可用-用户可以利用MGR实现单一分片的高可用,每个分片都具有一个复制组。

主从复制的替代选择-可以使用单主模式避免发生冲突检测,以替代传统的主从复制。

MGR架构:

MySQL高可用方案-MySQL InnoDB Cluster

GR插件负责执行分布式内容,侦测和处理冲突,恢复分布式集群,推送事务给其它的组成员,接收其它成员的事务以及决定事务最终的结果。

GCS群组通信系统

GCS API将通信系统的实现进行抽象化,并管理这个接口。通信引擎是基于Paxos开发的,是实现跨服务器的组件。

MGR在使用时具有两种模式,包括:

单主模式:

(1)单个MySQL实例作为数据写入的主节点,

(2)其它的节点用于热备。

优点:便于现有系统进行切换

多主模式:

群组内所有的成员都可以进行数据写入,读取操作。

因为多主模式需要确保数据写入的一致性,所以在使用上有如下限制:

(1)表必须有主键

(2)必须是InnoDb的引擎

(3)gtid-mode=on

(4)binlog格式是Row-based

(5)不支持serializable隔离级别

MGR的监视:

通过perforamnce_shcema里面的表和全局变量可以确认MGR的成员状态,当前主成员等必要信息。

MySQL Router:

(1)轻量级的中间件,可以提供负载均衡和应用连接的故障转移。

(2)通过使用 Router 和 Shell,利用 MGR 实现完整的数据库层的解决方案。

(3)它是一个会配合 MySQL 的开发路线图所发展的工具。

使Mysql应用能透明的使用高可用数据库

表现方式:

(1)client透明链接的路由(LB,应用连接的故障转移)

(2)无态化的设计使客户端的高可用得以简化(本地路由器成为应用技术堆栈的一部分)

优势:MysqlRouter可以在不影响现有的应用前提下,将单独的mysql实例,轻易的迁移到具有高可用的InnoDB分布式集群上

MySQL高可用方案-MySQL InnoDB Cluster

执行步骤:

1.执行配置的检查,之后连接到mysq1

2.执行dba.createCluster() 创建一个集群

3.最后执行 cluster.addInstance() 就可以将其它成员加入到集群

集群的故障排除与维护:

网络故障,高延迟,服务器的故障

cluster.options (集群的全局配选项,对每个集群成员的设置)

(1)expelTimeout(避免由于网络故障而频繁驱逐成员)

(2)memberWeight(发生故障转移时的下一个主要成员)

(3)exitStateAction(从集群中驱逐服务器时的操作,中止,只读,脱机模式)

(4)autoRejoinTries(驱逐后尝试重新加入)

MySQL高可用方案-MySQL InnoDB Cluster

搭建过程:

安装mysql-community-server、mysql-shell、mysql-router软件包。

(1)配置mysql的yum源

yum install -y https://dev.mysql.com/get/mysql80-community-release-el7-3.noarch.rpm

(2)安装

yum install -y mysql-community-server mysql-shell mysql-router

(3)把主机名称映射写入hosts文件中

(4)配置本地实例

(5)初始化MySQL InnoDB Cluster

(6)初始化mysql-router

遇到问题:

(1)如何重新恢复集群

var cluster=dba.getCluster('mycluster')

dba.rebootClusterFromCompleteOutage('mycluster')

(2)执行cluster.status()部分节点提示status:UNREACHABLE,此时集群不能正常响应只剩下一个活跃节点,此节点只能提供查询,无法写入,执行写入操作会僵住。

修复这种状态,需要执行forceQuorumUsingPartitionOf指定当前活跃节点(如果是多个则选择primary node),此时活跃节点可以提供读写操作,然后将其他节点加入此集群。

cluster.forceQuorumUsingPartitionOf('root@192.168.10.102:3306')

cluster.rejoinInstance('root@192.168.10.101:3306')

cluster.rejoinInstance('root@192.168.10.100:3306')

节点状态:

ONLINE - 节点状态正常。

OFFLINE - 实例在运行,但没有加入任何Cluster。

RECOVERING - 实例已加入Cluster,正在同步数据。

ERROR - 同步数据发生异常。

UNREACHABLE - 与其他节点通讯中断,可能是网络问题,可能是节点crash。

MISSING 节点已加入集群,但未启动group replication

集群状态:

OK:所有节点处于online状态,有冗余节点。

OK_PARTIAL:有节点不可用,但仍有冗余节点。

OK_NO_TOLERANCE:有足够的online节点,但没有冗余,例如:两个节点的Cluster,其中一个挂了,集群就不可用了。

NO_QUORUM:有节点处于online状态,但达不到法定节点数,此状态下Cluster无法写入,只能读取。

UNKNOWN:不是online或recovering状态,尝试连接其他实例查看状态。

UNAVAILABLE:组内节点全是offline状态,但实例在运行,可能实例刚重启还没加入Cluster。