【StoneDB Class】入门第一课:数据库知识科普

时间:2022-11-29 15:58:17


【StoneDB Class】入门第一课:数据库知识科普


在没有出现数据库之前,数据存储在文本中,这种数据存储方式不管是管理还是查询,效率都是极其低下的,数据之间没有关联性。到了1970年,IBM 研究员 E.F.Codd 发表了论文"A Relational Model of Data for Large Shared Data Banks",该论文中第一次提出了关系模型的概念,为关系型数据库奠定了理论基础,才有了后面涌现的如IBM的 DB2、甲骨文的 Oracle 等优秀的关系型数据库。一直到上世纪90年代,数据库都是以关系型数据库为主。但随着数据量的增长,关系型数据库已无法满足更多的应用场景,数据库领域便随之出现了非关系型数据库。


【StoneDB Class】入门第一课:数据库知识科普



数据库分类

数据库用于数据的存储和访问,不同类型的数据库满足不同的场景需求。如果你的数据库对事务没有要求,且读写是高并发的,那么你可以选择一款非关系型数据库。如果你的数据库主要存储历史数据,且访问频率少,那么你可以选择一款高压缩比,且读优化的数据库。如果你的数据库既有交易类业务,又有复杂分析类业务,那么你可以选择一款有混合存储引擎的数据库。


【StoneDB Class】入门第一课:数据库知识科普


数据库按照数据模型来划分,可分为关系型数据库和非关系型数据库。关系型数据库的数据是高度组织化和结构化的,可以使用结构化查询语言进行复杂的查询。非关系型数据库的数据是非结构化的,没有声明性查询语言,代表着不仅仅是SQL。关系型数据库注重事务的强一致性,而非关系型数据库注重可扩展性。数据库市场使用广泛的关系型数据库有 Oracle 、 MySQL 、 SQL Server ,数据库市场使用广泛的非关系型数据库有 Redis 、MongoDB 。


数据库按照数据分布来划分,可分为集中式数据库和分布式数据库。集中式数据库是一个或者多个数据库实例管理一份数据,每个数据库实例都可以看到全部数据,属于 Shared-Everything 架构。分布式数据库是每个数据库实例管理自己的数据,全量数据是所有数据库实例管理的数据的总和,属于 Shared-Nothing 架构。


【StoneDB Class】入门第一课:数据库知识科普


数据库按照数据处理来划分,可分为 OLTP 数据库、OLAP 数据库以及 HTAP 数据库,StoneDB 就是一款一体化实时 HTAP 数据库,后面几个课程会给大家深入介绍。OLTP 数据库适用于交易类系统,特征是大并发的小型事务处理,单次处理的数据量小。OLAP 数据库适用于分析类系统,特征是并发小,系统吞吐量高,单次处理的数据量大。HTAP 数据库是一种新型的架构,指的是混合事务和分析处理过程,出现 HTAP 的目的是打破 OLTP 和 OLAP 之间的壁垒。


【StoneDB Class】入门第一课:数据库知识科普



数据库瓶颈

传统数据库经过五十多年的发展,不管是数据库本身的稳定性,还是数据库厂商的技术支持度,都已经非常的成熟。数据库厂商在官网提供的丰富学习资料,对使用者来说很容易学习这款数据库。但随着时代的发展,特别是出现互联网技术,数据库的数据量是指数增长的,那么传统数据库不仅在并发和存储上存在瓶颈,在可扩展性也是有限的。


当传统关系型数据库出现无法满足业务场景的需求,如出现高并发的海量数据存储时,出现了分布式数据库。分布式数据库由多台服务器组成,不仅提供更多的连接访问,还提供更多的存储容量,在可扩展性方面也是线性的。分布式数据库解决了传统数据库的瓶颈,然而分布式数据库也不是完美得无懈可击。


在事务一致性方面,传统数据库很容易保证 ACID 。而分布式数据库由多个数据库实例组成。这些实例分布在一个网络环境中。为了保证事务的一致性,分布式数据库引入了两阶段提交、三阶段提交、补偿事务。分布式事务的管理开销较大,比如要求支持悲观锁,这就导致即使一致性读无需持有锁,但查询也可能会被阻塞。


在基于成本的执行计划方面,由于数据分布在不同的节点,再加上分布式算法的复杂度,SQL 是否能保证有一个稳定的执行计划。


在数据一致性方面,分布式数据库以多副本进行存储时,数据的一致性问题变得更为复杂。假设数据库发生故障时,某副本正在更新。如何保证故障恢复后各副本之间的一致性是个难题。


【StoneDB Class】入门第一课:数据库知识科普



国产数据库

在数据库市场上,国外数据库厂商一直以来处于绝对的主导地位。但随着近几年 IT 国产化战略的提出,国内涌现出了不少优秀的数据库厂商,逐渐形成了百家争鸣之势。有发展多年的关系型数据库,如达梦、人大金仓、南大通用等;有势头猛进的分布式交易型数据库,如 TiDB 、 OceanBase 等;也有稳扎稳打的分布式分析型数据库 GaussDB;当然还有诸如 StoneDB 这样的专注于提供 TP 和 AP 统一解决方案的 HTAP 数据库新星厂商。


【StoneDB Class】入门第一课:数据库知识科普

(国产数据库概览)


StoneDB 作为自主设计、研发的国内首款基于 MySQL 内核打造的开源 HTAP 数据库,在同一个数据库实例中采用行列混合存储的方案,解决了 TP 和 AP 之间数据同步处理较为麻烦的问题,同时可实现与 MySQL 的无缝切换。100%兼容 MySQL 的 StoneDB 让运维工作变的更简单,用户体验也更加丝滑。


以上是本次课程的全部内容,下节课我们将带大家深入了解 StoneDB 的系统架构和功能特点。如果您对 StoneDB 感兴趣,可以通过下方链接查看 StoneDB 源码、阅读文档,期待您的贡献!



StoneDB 开源仓库

​https://github.com/stoneatom/stonedb​