TimescaleDB比拼InfluxDB：如何选择合适的时序数据库？

https://www.itcodemonkey.com/article/9339.html

时序数据已用于越来越多的应用中，包括物联网、DevOps、金融、零售、物流、石油天然气、制造业、汽车、太空、SaaS，乃至机器学习和人工智能。虽然当前时序数据库仅局限于采集度量和监控，但是软件开发人员已经逐渐明白，他们的确需要一款时序数据库，真正设计用于运行多种工作负载。

如果我们考虑采用一款时序数据库产品，这可能意味着我们正面对大量时序数据的快速堆积。我们需要一个地方对这些时序数据进行存储和分析。人们此时可能已经认识到，业务的存活严重地依赖于所选取的数据库。

如何选取时序数据库

在评估工作负载所使用的时序数据库时，需考虑多个因素：

数据模型；
查询语言；
可靠性；
性能；
生态系统；
运维管理；
企业 / 社区的支持情况.

本文中，我们将对比两款业界领先的时序数据库，TimescaleDB（https://www.timescale.com/?utm_source=timescale-blog&utm_medium=referral&utm_campaign=influx-benchmark-post&utm_content=firstlink）和 InfluxDB（https://www.influxdata.com/），意在为软件开发人员正确选取所需的时序数据库提供参考。

数据库对比测试通常聚焦于性能基准测试。性能只是整体测试的一部分，如果数据库的数据模型或查询语言不匹配，或者因为数据库缺乏可靠性，导致数据库不能用于生产环境中，那么无论基准测试的结果多么好，都毫无意义。考虑到这一点，在深入开展性能基准测试之前，我们着手从数据模型、查询语言和可靠性这三个定量维度对比 TimescaleDB 和 InfluxDB。然后，我们对整个数据库生态系统范围、运维管理以及企业 / 社区支持情况做出对比。

当然，我们本身就是 TimescaleDB 的开发人员。读者可能会认为我们的比较会有偏颇。从分析本身看，我们力图保持客观。事实上，我们也报告了 InfluxDB 优于 TimescaleDB 的一些场景。

此外，这次比较并非完全理论上的。我们的企业最初是一家物联网平台。在该平台上，我们最初选用 InfluxDB 存储传感器数据。但是考虑到本文下面将列出的一些差异之处，我们发现 InfuxDB 并不能满足我们的需求。基于此，我们构建了首个满足需求的时序数据库 TimescaleDB，并发现了对该数据库具有需求的其它一些客户，因此我们决定将数据库开源。当前在不到一年半的时间中，TimescaleDB 已经被下载数十万次，并在全球范围内的生产环境中使用（更多信息，参见我们介绍 TimescaleDB 的起源一文 https://blog.timescale.com/when-boring-is-awesome-building-a-scalable-time-series-database-on-postgresql-2900ea453ee2）。

最后，本文意在帮助读者面对需要使用时序数据库的情况时做出最后的判断。

为什么没有考虑“可扩展性”因素？

如果读者仔细查看上面列出的考虑因素清单，就会发现其中缺少“可扩展性”和“集群”因素。我们发现，开发人员在请求任何两者之一时，其实他们真正需要的是性能度量、高可用性和存储能力的某种组合。我们认为，单独给出上述三方面因素将更具意义，而不是以某个包罗万象的数据一言蔽之。因此在本文中我们也正是这么做的。

数据模型

数据库天性顽固。数据的建模和存储方式将会影响对数据库的使用。

在数据模型方面，TimescaleDB 和 InfluxDB 存在两种完全不同的观点。TimescaleDB 是一种关系型数据，而 InfluxDB 更多的则是一种定制的、NoSQL 的非关系型数据库。这意味着 TimescaleDB 是基于关系数据库模型的，而关系模型在 PostgreSQL、MySQL、SQL Server、Oracle 等数据库中得到了普遍的应用。另一方面，InfluxDB 提出了自己的数据模型。在本文的对比中，我们将该数据模型称为“Tagset 数据模型”。

关系数据模型

关系数据模型至今已使用了数十年。TimescaleDB 使用关系模型，每个时序测量值记录为单独一行数据，其中记录时间的字段后跟随任意数量的其它字段，字段类型可以是 float、int、string、boolean、数组和 JSON BLOB 等，甚至是更复杂的数据类型。用户可在任一字段上创建索引（标准索引），也可对多个字段创建索引（即复合索引），甚至可以对函数等表达式创建索引，并可限定对部分行创建索引（即部分索引）。任何建了索引的字段都可作为指向另一个表的外键，进而用于存储更多的元数据。