《大规模分布式存储系统:原理解析与架构实战》读书笔记

时间:2022-09-13 21:51:14

《大规模分布式存储系统:原理解析与架构实战》读书笔记

1、事务满足ACID特性

2、单机存储引擎:哈希存储引擎和B树存储引擎和LSM存储引擎。存储系统的数据模型:文件模型、关系模型和键值模型。

3、分布式系统:数据分布、复制、一致性、容错。

数据分布的方式:哈希分布和顺序分布。将数据 分散到多台机器之后,需要保证多台机器之间的负载均衡。衡量负载涉及的因素有很多,如cpu,内存。负载均衡需要执行数据迁移操作。
分布式存储系统通过复制协议将数据同步到多个存储节点,并确保多个副本之间的数据一致性。复制协议分为强同步复制以及异步复制。分布式存储系统中的数据保存多个副本,其中一个为主副本,其它为备副本,常见的做法是将数据写入到主副本,由主副本确定操作的顺序并复制到其他副本。强同步协议提供强一致性,但是可用性差。异步复制可用性较好,但是一致性较差。主副本之间的复制一般通过操作日志来实现。除基于主副本之间的复制协议,还由基于多个存储节点的复制协议。
一致性:强一致性、弱一致性、最终一致性。
首先分布式系统,故障检测通过租约协议实现。接着,需要能够将服务复制或者迁移到集群中的其它正常服务的存储节点。

4、CAP理论:一致性、可用性和分区可容忍性三者不能同时得到。

5、两阶段提交协议和Paxos协议。两阶段提交协议包括请求阶段和提交阶段,是阻塞协议。Paxos协议过程:准备阶段、批准阶段和确认阶段。