cassandra表中主键的类型

时间:2023-03-09 10:00:34
cassandra表中主键的类型

cassandra表中主键的类型及区分?

cassandra表中主键的类型

一、类型及区分

Cassandra的4种Key

  1. Primary Key 主键
  2. Composite Key,Compound Key 复合键
  3. Partition Key 分区键
  4. Clustering Key 集群

1.主键 Primary Key(简单主键)

  • 是用来获取某一行的数据, 可以是单一列(Single column Primary Key)或者多列(Composite Primary Key)。
  • 在 Single column Primary Key 决定这一条记录放在哪个节点。

例:Student_id是student的主键

create table student (Student_id int primary key, Sname text, Sbirth timestamp, Snum text, Sphone text );

查询后会发现主键和普通键的颜色不一样。
cassandra表中主键的类型

2.复合键 Composite Primary Key

  • 如果 Primary Key 由多列组成,那么这种情况称为 Compound Primary Key 或 Composite Primary Key。

查询testtab,会发现key_one和key_two 的颜色与其他列不一样cassandra表中主键的类型

复合主键由主键中引用的一个或多个列组成。复合主键的一个组件称为分区键,而另一个组件称为分簇列。以下是主键的不同变化。请注意,C1、C2、C3,…等表示表中的列。

  • C1:主键只有一个分区键,没有分簇列。
  • (C1,C2):列C1是分区键,列C2是分簇列。
  • (C1,C2,C3,…):列C1是分区键,列C2,C3等构成分簇列。
  • (C1,(C2,C3,…)):与3相同,即C1列是分区键,C2,C3…列构成分簇列。
  • ((C1,C2),C3),C1,C2,C3作为复合主键,C1,C2作为复合的分区键,C3作为分簇键
  • (((C1,C2,…),(C3,C4,…))):列C1,C2作分区键,列C3,C4,…作分簇列。

需要注意的是,当复合键是 C1、C2、C3 时,第一个键C1 将成为分区键,其余键成为集群键的一部分。为了制作复合分区键,我们必须在括号中指定键,例如:((C1,C2),C3,C4)。在这种情况下,C1 和 C2 是分区键的一部分,C3 和 C4 是集群键的一部分。

3.分区键 Partition Key

  • 在组合主键的情况下(上面的例子),第一部分称作Partition Key(key_one就是partition key),第二部分是clustering key(key_two)
  • Cassandra会对Partition key 做一个hash计算,并自己决定将这一条记录放在哪个节点。
  • 如果 Partition key 由多个字段组成,称之为 Composite Partition key

例:

create table testTab (
key_part_one int,
key_part_two int,
key_clust_one int,
key_clust_two int,
key_clust_three uuid,
name text,
PRIMARY KEY((key_part_one,key_part_two), key_clust_one, key_clust_two,key_clust_three)

查询后会发现分区键,集群键和普通键的颜色不一样。
cassandra表中主键的类型

分区键在assandra中具有特殊用途,除了显示数据库中记录的独特性。另一个目的,即在分布式系统中非常关键的一个目的是确定数据位置。当数据插入集群时,第一步是在分区键上应用哈希功能。输出用于确定哪个节点(和副本)将获取数据。阿帕奇·卡桑德拉使用的算法使用Murmur3,这将采取任意输入,并创建一致的令牌值。该令牌值将属于单个节点拥有的令牌范围。简言之,分区键始终属于一个节点,该分区的数据始终位于该节点上。为什么这很重要?如果没有分区数据的绝对位置,则需要搜索集群中的每个节点以查找您的数据。在小集群中,这可能很快完成,但在更大的集群中,速度会非常缓慢。

4. 集群-分簇列(Clustering Key)

  • 分簇列的目的是按排序顺序存储行数据。数据排序基于列,列包含在聚类密钥中。此排列可高效使用聚类密钥检索数据。
create table test_demo (name text,No int,phone list<text>,primary key(name,No))
with clustering order by (No desc)
// 定义分列簇为No,并说明分列簇按降序排序(DESC),升序为(ASC)

由于cassandra 底层采用键值对数据结构,因此,理论上主键、分区键和分簇键都属于行键的一部分

Example:

  1. 创建键空间
    cassandra表中主键的类型

  2. 切换到students_details键空间:
    cassandra表中主键的类型

  3. 创建一个表,其中包含有关任何学生的一般信息。student
    cassandra表中主键的类型

  4. 向表中插入数据
    cassandra表中主键的类型

  5. 使用 cqlsh 中的扩展命令,我们可以查看查询的详细信息。在没有参数的扩展中显示扩展设置的当前值。
    cassandra表中主键的类型

  • 注意如果扩展关闭(disable),要开启它(expand on),关闭为(expand off)
  • 然后查看插入上述详细信息(研究将以 cqlsh 中的红色呈现,代表主键/行键)
  • 从上述输出中,我们可以看到num已成为行键,并且它标识了单个行。
    cassandra表中主键的类型
    我们可以看到有三个tokens。
  1. 我们可以使用主键中的列来过滤
    cassandra表中主键的类型

二、参考文章

https://dzone.com/articles/cassandra-data-modeling-primary-clustering-partiti

https://www.datastax.com/blog/2016/02/most-important-thing-know-cassandra-data-modeling-primary-key