从Paxos到Zookeeper分布式一致性原理与实践 读书笔记之(一) 分布式架构

时间:2022-03-23 19:43:10

1.1 从集中式到分布式

1 集中式特点

结构简单,无需考虑对多个节点的部署和节点之间的协作。

2  分布式特点

分不性:在时间可空间上随意分布,机器的分布情况随时变动

对等性:计算机之间没有主从之分,所有计算机之间是对等的。副本是分布式系统对数据和服务提供的一种冗余手段。

数据副本,是指在不同的节点上持久化同一份数据,只是解决分布式系统数据丢失的最有效手段。

服务副本,多个节点提供同样的服务,每个节点有能力接受外部的请求并进行处理。

并发性

缺乏全局时钟:很难定义两个事件的顺序谁先谁后,原因是缺乏全局时钟序列控制。

故障总是会发生:组成分布式系统的所有计算机随时可能发生各种形式的故障。

3 分布式环境各种问题

通信异常

网络分区:当网络发生异常,系统中部分节点之间网络延时不断增大,最终导致只有部分节点能够通信,另一些节点不能。这一现象叫网络分区,或者“脑裂”。

三态:失败、成功与超时。

节点故障:组成分布式系统的节点宕机或者“僵尸”,每个节点都会发生,每天都在发生。

1.2从ACID到CAP/BASE

1 ACID

原子性

全部成功执行

全部不执行

一致性

隔离性

未授权读取

授权读取

可重复读:事务处理过程中,多次读取数据是一致的。

串行化:所有事务被串行执行,是最严重的事务隔离级别。

隔离级别 脏读(Dirty Read) 不可重复读(NonRepeatable Read) 幻读(Phantom Read)
未授权读取 (Read uncommitted) 可能 可能 可能
授权读取(Read committed) 不可能 可能 可能
可重复读(Repeatable read) 不可能 不可能 可能
串行化(Serializable ) 不可能 不可能 不可能

级别越高,数据越安全,但性能越低。(不可重复读针对的是读取过程中其他线程对数据 update或delete,幻读针对insert进去符合条件的数据。)

持久性:指一个事务提交,它对数据的修改是永久性的。

2 分布式事务

3 CAP和BASE理论

CAP:一个分布式系统不可能同时满足一致性、可用性、分区容错性,这三基本要求最多只能满足其中的两个。

一致性:在多个副本中的数据是否能保持一致。

可用性:指系统提供的服务是否一致可用,对用户的请求是否能在有限的时间内返回结果。

分区容错性:在遇到任何网络故障的时候,仍然满足一致性和可用性的服务。

对一个分布式系统而言,分区容错性是一个最基本的要求。

Base理论:面向的是大型高可用可扩展的分布式系统,和传统事务的ACID不一样,它完全不同于ACID的强一致性模型,而是提出通过牺牲强一致性来获取数据在一段时间内是不一致的,但最终达到一致状态。

基本可用:分布式系统出现不可预知故障时,允许损失部分可用性。

响应时间上的损失

功能上的损失

弱状态:允许不同副本数据同步时候的传输延时。

最终一致性:指系统中所有的副本,在经过一段时间的同步之后,最终能够达到一个一致的状态。