oracle表空间表分区详解及oracle表分区查询使用方法

时间:2021-06-06 12:17:56

本文转载:点击打开链接

1.表空间及分区表的概念

表空间:是一个或多个数据文件的集合,所有的数据对象都存放在指定的表空间中,但主要存放的是表, 所以称作表空间。

分区表: 当表中的数据量不断增大,查询数据的速度就会变慢,应用程序的性能就会下降,这时就应该考虑对表进行分区。表进行分区后,逻辑上表仍然是一张完整的表,只是将表中的数据在物理上存放到多个表空间(物理文件上),这样查询数据时,不至于每次都扫描整张表。

2.表分区的具体作用

Oracle的表分区功能通过改善可管理性、性能和可用性,从而为各式应用程序带来了极大的好处。通常,分区可以使某些查询以及维护操作的性能大大提高。此外,分区还可以极大简化常见的管理任务,分区是构建千兆字节数据系统或超高可用性系统的关键工具。

分区功能能够将表、索引或索引组织表进一步细分为段,这些数据库对象的段叫做分区。每个分区有自己的名称,还可以选择自己的存储特性。从数据库管理员的角度来看,一个分区后的对象具有多个段,这些段既可进行集体管理,也可单独管理,这就使数据库管理员在管理分区后的对象时有相当大的灵活性。但是,从应用程序的角度来看,分区后的表与非分区表完全相同,使用 SQL DML 命令访问分区后的表时,无需任何修改。

 

什么时候使用分区表:

1、表的大小超过2GB。

2、表中包含历史数据,新的数据被增加都新的分区中。

 

3.表分区的优缺点

表分区有以下优点: 

1、改善查询性能:对分区对象的查询可以仅搜索自己关心的分区,提高检索速度。

2、增强可用性:如果表的某个分区出现故障,表在其他分区的数据仍然可用;

3、维护方便:如果表的某个分区出现故障,需要修复数据,只修复该分区即可;

4、均衡I/O:可以把不同的分区映射到磁盘以平衡I/O,改善整个系统性能。

缺点: 

分区表相关:已经存在的表没有方法可以直接转化为分区表。不过 Oracle 提供了在线重定义表的功能。

 

4.表分区的几种类型及操作方法

(1)范围分区(range);

(2)哈希分区(hash);

(3)列表分区(list);

(4)范围-哈希复合分区(range-hash);

(5)范围-列表复合分区(range-list);


 (1)范围(range)分区:

范围分区将数据基于范围映射到每一个分区,这个范围是你在创建分区时指定的分区键决定的。这种分区方式是最为常用的,并且分区键经常采用日期。举个例子:你可能会将销售数据按照月份进行分区。

当使用范围分区时,请考虑以下几个规则:

1、每一个分区都必须有一个VALUES LESS THEN子句,它指定了一个不包括在该分区中的上限值。分区键的任何值等于或者大于这个上限值的记录都会被加入到下一个高一些的分区中。

2、所有分区,除了第一个,都会有一个隐式的下限值,这个值就是此分区的前一个分区的上限值。

3、在最高的分区中,MAXVALUE被定义。MAXVALUE代表了一个不确定的值。这个值高于其它分区中的任何分区键的值,也可以理解为高于任何分区中指定的VALUE LESS THEN的值,同时包括空值。

 

例一:

假设有一个CUSTOMER表,表中有数据200000行,我们将此表通过CUSTOMER_ID进行分区,每个分区存储100000行,我们将每个分区保存到单独的表空间中,这样数据文件就可以跨越多个物理磁盘。下面是创建表和分区的代码,如下:

CREATE TABLECUSTOMER
(
CUSTOMER_ID NUMBER NOTNULLPRIMARYKEY,
FIRST_NAME VARCHAR2(30) NOTNULL,
LAST_NAME VARCHAR2(30) NOTNULL,
PHONE VARCHAR2(15) NOTNULL,
EMAIL VARCHAR2(80),
STATUS CHAR(1)
) PARTITIONBYRANGE(CUSTOMER_ID)
(
PARTITIONCUS_PART1 VALUES LESSTHAN(100000) TABLESPACECUS_TS01,
PARTITIONCUS_PART2 VALUES LESSTHAN(200000) TABLESPACECUS_TS02
)

例二:按时间划分

CREATE TABLEORDER_ACTIVITIES
(
ORDER_ID NUMBER(7) NOTNULL,
ORDER_DATE DATE,
TOTAL_AMOUNT NUMBER,
CUSTOTMER_ID NUMBER(7),
PAID CHAR(1)
)
PARTITION BYRANGE(ORDER_DATE)
(
PARTITIONORD_ACT_PART01 VALUES LESSTHAN(TO_DATE('01-MAY -2003','DD-MON-YYYY'))TABLESPACEORD_TS01,
PARTITIONORD_ACT_PART02 VALUESLESSTHAN(TO_DATE('01-JUN-2003','DD-MON-YYYY'))TABLESPACEORD_TS02,
PARTITIONORD_ACT_PART02 VALUES LESSTHAN(TO_DATE('01-JUL-2003','DD-MON-YYYY'))TABLESPACEORD_TS03
);


例三:MAXVALUE

CREATE TABLERangeTable
(
idd INT PRIMARYKEY,
iNAME VARCHAR(10),
grade INT
)
PARTITION BY RANGE (grade)
(
PARTITION part1 VALUES LESS THAN (1000) TABLESPACE Part1_tb,
PARTITION part2 VALUES LESS THAN (MAXVALUE)TABLESPACE Part2_tb
);

(2)列表(list)分区:

该分区的特点是某列的值只有几个,基于这样的特点我们可以采用列表分区。

例一

CREATE TABLEPROBLEM_TICKETS
(
PROBLEM_ID NUMBER(7) NOTNULLPRIMARYKEY,
DESCRIPTION VARCHAR2(2000),
CUSTOMER_ID NUMBER(7) NOTNULL,
DATE_ENTERED DATE NOTNULL,
STATUS VARCHAR2(20)
)
PARTITION BYLIST(STATUS)
(
PARTITIONPROB_ACTIVE VALUES('ACTIVE')TABLESPACEPROB_TS01,
PARTITIONPROB_INACTIVE VALUES ('INACTIVE')TABLESPACEPROB_TS02
);

(3)散列(hash)分区:

这类分区是在列值上使用散列算法,以确定将行放入哪个分区中。当列的值没有合适的条件时,建议使用散列分区。
散列分区为通过指定分区编号来均匀分布数据的一种分区类型,因为通过在I/O设备上进行散列分区,使得这些分区大小一致。

例一:

CREATE TABLEHASH_TABLE
(
COL NUMBER(8),
INF VARCHAR2(100)
)
PARTITION BYHASH(COL)
(
PARTITIONPART01 TABLESPACE HASH_TS01,
PARTITIONPART02 TABLESPACE HASH_TS02,
PARTITIONPART03 TABLESPACE HASH_TS03
);

简写:

CREATE TABLE EMP
(
EMPNO NUMBER (4),
ENAME VARCHAR2 (30),
SAL NUMBER
)
PARTITION BY HASH (EMPNO) PARTITIONS 8
STORE IN (EMP1,EMP2,EMP3,EMP4,EMP5,EMP6,EMP7,EMP8);

hash分区最主要的机制是根据hash算法来计算具体某条纪录应该插入到哪个分区中,hash算法中最重要的是hash函数,Oracle中如果你要使用hash分区,只需指定分区的数量即可。建议分区的数量采用2的n次方,这样可以使得各个分区间数据分布更加均匀。


(4)组合范围散列(range-list)分区

这种分区是基于范围分区和列表分区,表首先按某列进行范围分区,然后再按某列进行列表分区,分区之中的分区被称为子分区。

CREATE TABLESALES
(
PRODUCT_ID VARCHAR2(5),
SALES_DATE DATE,
SALES_COST NUMBER(10),
STATUS VARCHAR2(20)
)
PARTITION BYRANGE(SALES_DATE)SUBPARTITIONBYLIST(STATUS)
(
PARTITIONP1 VALUES LESSTHAN(TO_DATE('2003-01-01','YYYY-MM-DD'))TABLESPACERPTFACT2009
(
SUBPARTITIONP1SUB1 VALUES ('ACTIVE')TABLESPACERPTFACT2009,
SUBPARTITIONP1SUB2 VALUES ('INACTIVE')TABLESPACERPTFACT2009
),
PARTITIONP2 VALUES LESSTHAN(TO_DATE('2003-03-01','YYYY-MM-DD'))TABLESPACERPTFACT2009
(
SUBPARTITIONP2SUB1 VALUES ('ACTIVE')TABLESPACERPTFACT2009,
SUBPARTITIONP2SUB2 VALUES ('INACTIVE')TABLESPACERPTFACT2009
)
);

(5).复合范围散列(range-hash)分区:

这种分区是基于范围分区和散列分区,表首先按某列进行范围分区,然后再按某列进行散列分区。

CREATE TABLEDINYA_TEST
(
TRANSACTION_ID NUMBERPRIMARYKEY,
ITEM_ID NUMBER(8) NOTNULL,
ITEM_DESCRIPTION VARCHAR2(300),
TRANSACTION_DATE DATE
)
PARTITIONBYRANGE(TRANSACTION_DATE)SUBPARTITIONBYHASH(TRANSACTION_ID)SUBPARTITIONS3 STORE IN(DINYA_SPACE01,DINYA_SPACE02,DINYA_SPACE03)
(
PARTITIONPART_01 VALUES LESSTHAN(TO_DATE('2006-01-01','YYYY-MM-DD')),
PARTITIONPART_02 VALUES LESSTHAN(TO_DATE('2010-01-01','YYYY-MM-DD')),
PARTITIONPART_03 VALUES LESSTHAN(MAXVALUE)
);


5.有关表分区的一些维护性操作

(1)添加分区

以下代码给SALES表添加了一个P3分区

 

ALTER TABLESALES ADD PARTITIONP3 VALUES LESSTHAN(TO_DATE('2003-06-01','YYYY-MM-DD'));

注意:以上添加的分区界限应该高于最后一个分区界限。
以下代码给SALES表的P3分区添加了一个P3SUB1子分区

ALTER TABLESALES MODIFY PARTITIONP3 ADD SUBPARTITIONP3SUB1 VALUES('COMPLETE');

(2)删除分区 

以下代码删除了P3表分区:

ALTER TABLESALES DROP PARTITIONP3;

在以下代码删除了P4SUB1子分区:

ALTER TABLESALES DROP SUBPARTITIONP4SUB1;


注意:如果删除的分区是表中唯一的分区,那么此分区将不能被删除,要想删除此分区,必须删除表。

(3)截断分区

截断某个分区是指删除某个分区中的数据,并不会删除分区,也不会删除其它分区中的数据。当表中即使只有一个分区时,也可以截断该分区。通过以下代码截断分区:

ALTER TABLESALES TRUNCATE PARTITIONP2;

通过以下代码截断子分区:

ALTER TABLESALES TRUNCATE SUBPARTITIONP2SUB2;

(4)合并分区

合并分区是将相邻的分区合并成一个分区,结果分区将采用较高分区的界限,值得注意的是,不能将分区合并到界限较低的分区。以下代码实现了P1 P2分区的合并:

ALTER TABLESALES MERGE PARTITIONSP1,P2 INTOPARTITIONP2;

(5)拆分分区

拆分分区将一个分区拆分两个新分区,拆分后原来分区不再存在。注意不能对HASH类型的分区进行拆分。

ALTER TABLESALES SPLIT PARTITIONP2 AT(TO_DATE('2003-02-01','YYYY-MM-DD'))INTO(PARTITIONP21,PARTITION P22);

(6)接合分区(coalesca) 

结合分区是将散列分区中的数据接合到其它分区中,当散列分区中的数据比较大时,可以增加散列分区,然后进行接合,值得注意的是,接合分区只能用于散列分区中。通过以下代码进行接合分区:

ALTER TABLESALES COALESCA PARTITION;

(7)重命名表分区

以下代码将P21更改为P2

ALTER TABLESALES RENAME PARTITIONP21 TO P2;

(8)相关查询

a.跨分区查询

SELECT SUM(CN)FROM
(SELECT COUNT(*)CN
FROM T_TABLE_SS PARTITION(P200709_1)
UNION ALL
SELECT COUNT(*)CN
FROM T_TABLE_SS PARTITION(P200709_2));

b.查询表上有多少分区

SELECT * FROMuseR_TAB_PARTITIONS WHERE TABLE_NAME='tableName'

c.查询索引信息

SELECT OBJECT_NAME,OBJECT_TYPE,TABLESPACE_NAME,SUM(VALUE)
FROM V$SEGMENT_STATISTICS
WHERE STATISTIC_NAME IN('physicalreads','physical write','logicalreads')AND OBJECT_TYPE='INDEX'
GROUP BY OBJECT_NAME,OBJECT_TYPE,TABLESPACE_NAME
ORDER BY 4 DESC;
--显示数据库所有分区表的信息:SELECT * FROMDBA_PART_TABLES --显示当前用户可访问的所有分区表信息:SELECT * FROMALL_PART_TABLES --显示当前用户所有分区表的信息:SELECT * FROMUSER_PART_TABLES --显示表分区信息显示数据库所有分区表的详细分区信息:SELECT * FROMDBA_TAB_PARTITIONS --显示当前用户可访问的所有分区表的详细分区信息:SELECT * FROMALL_TAB_PARTITIONS --显示当前用户所有分区表的详细分区信息:SELECT * FROMUSER_TAB_PARTITIONS --显示子分区信息显示数据库所有组合分区表的子分区信息:SELECT * FROMDBA_TAB_SUBPARTITIONS --显示当前用户可访问的所有组合分区表的子分区信息:SELECT * FROMALL_TAB_SUBPARTITIONS --显示当前用户所有组合分区表的子分区信息:SELECT * FROMUSER_TAB_SUBPARTITIONS --显示分区列显示数据库所有分区表的分区列信息:SELECT * FROMDBA_PART_KEY_COLUMNS --显示当前用户可访问的所有分区表的分区列信息:SELECT * FROMALL_PART_KEY_COLUMNS --显示当前用户所有分区表的分区列信息:SELECT * FROMUSER_PART_KEY_COLUMNS --显示子分区列显示数据库所有分区表的子分区列信息:SELECT * FROMDBA_SUBPART_KEY_COLUMNS --显示当前用户可访问的所有分区表的子分区列信息:SELECT * FROMALL_SUBPART_KEY_COLUMNS --显示当前用户所有分区表的子分区列信息:SELECT * FROMUSER_SUBPART_KEY_COLUMNS --怎样查询出oracle数据库中所有的的分区表SELECT * FROMUSER_TABLES A WHEREA.PARTITIONED='YES' --删除一个表的数据TRUNCATE TABLETABLE_NAME; --删除分区表一个分区的数据是ALTER TABLETABLE_NAME TRUNCATE PARTITIONP5;