1 顺序表

时间:2024-02-17 12:44:50

1 顺序表

核心公式:

程序 = 算法 + 数据结构

程序设计 = 算法 + 数据结构 + 编程范式

数据结构 = 结构定义 + 结构操作

1定义

顺序表是一种线性表数据结构,即线性结构;它用一段连续的内存空间 来存储一组具有相同类型 的数据。

  • 线性表(Linear List):顾名思义,线性表就是数据排成像一条线一样的结构。每个线性表上的数据最多只有前和后两个方向。其中,顺序表、链表、队列、栈等都是线性表结构。

  • 非线性表:是与线性表相对的概念,如二叉树、堆、图等。之所以叫非线性,是因为,在非线性表中,数据之间并不是简单的前后关系。

2 性质

1. 高效的随机访问

  • 由于顺序表具有连续的内存空间和相同类型数据,故支持“随机访问”;

  • 由于顺序表具有连续的内存空间,故其下标从“0”开始;寻址公式: data[i] = base_address + i * sizeof(data_type), base_address 为存储空间的首地址。

  • 注:随机访问 != 查找O(1) ,因为二分查找的复杂度为O(logn);但是,按照数组索引方式访问数据,其复杂度为O(1)

  • 由于要保证物理内存的连续性,所以对于顺序表的“插入”和“删除”操作效率非常低,因为需要移动大量的数据元素。

2. 低效的插入与删除

  • 假设顺序表的长度为 n,现在,如果我们需要将一个数据插入到顺序表中的第 k 个位置。为了 把第 k 个位置腾出来,给新来的数据,我们需要将第 k~n 这部分的元素都顺序地往后挪一 位;

  • 如果在数组的末尾插入元素,那就不需要移动数据了,这时的时间复杂度为 O(1)

  • 但如果在数组的开头插入元素,那所有的数据都需要依次往后移动一位,所以最坏时间复杂度是 O(n)

  • 因为我们在每个位置插入元素的概率是一样的,所以平均情况时间复杂度为 (1+2+ …n)/n=O(n)

  • 跟插入数据类似,如果我们要删除第 k 个位置的数据,为了内存的连续性,也需要将k~n这部分的元素都顺序的前移一位;

  • 优化方法:建议“插入”和“删除”操作顺序表中的最后一位元素;

1. 插入操作

image

2. 删除操作

image

3. 动态扩容(realloc)

  • 因为顺序表本身在定义时,需要预先指定空间大小,因为需要分配连续的内存空间;当顺序表的预定义的存储空间使用完毕后,此时再“插入”元素时,就需要申请一块更大的存储空间,一般建议是预定义空间大小的2倍;

  • 注:因为扩容操作涉及内存申请和数据搬移,是比较耗时的。所以, 如果事先能确定需要存储的数据大小,最好在创建 顺序表 的时候事先指定数据大小;

image

3代码演示

#include <stdio.h>
#include <stdlib.h>
#include <time.h>

#define COLOR(a, b) "\033[" #b "m" a "\033[0m"
#define GREEN(a) COLOR(a, 32)
#define RED(a) COLOR(a, 31)

typedef struct Vector {
    int *data;          // 指向一片连续的存储空间
    int size, length;   // size:顺序表的最大容量,length:当前顺序表中数据元素的个数
} Vec;

Vec *init(int);                 // 初始化,生成一片连续的存储空间
int insert(Vec *, int, int);    // 插入,成功:1,失败:0
int erase(Vec *, int);          // 删除,成功:1,失败:0
void clear(Vec *);              // 清空
void output(Vec *);             // 遍历

int main() {
    #define MAX_N 20
    Vec * v = init(1);
    srand(time(0));
    for (int i = 0; i < MAX_N; i++) {
        int op = rand() % 4;
        int ind = rand() % (v->length + 3) - 1; // ind 的取值范围:[-1, v->length + 1]
        int val = rand() % 100;
        switch (op) {
            case 0:
            case 1:
            case 2: {
              printf("insert %d at %d to the Vector = %d\n", val, ind, insert(v, ind, val));
            } break;
            case 3: {
              printf("erase an item at %d from the Vector = %d\n", ind, erase(v, ind));
            } break;
        }
        output(v), printf("\n");
    }
    #undef MAX_N
    clear(v);
    
    return 0;
}

Vec *init(int n) {
    Vec *v = (Vec *)malloc(sizeof(Vec));
    v->data = (int *)malloc(sizeof(int) * n);
    v->size = n;
    v->length = 0;
    return v;
}

// 动态申请空间的方式:malloc、calloc、realloc
// calloc 相对于 malloc 而言,所申请的空间清零
// realloc 重新申请空间 void *realloc(void *ptr, size_t new_size);
// 1 扩张ptr所指向的已存在内存
// 2 分配一个大小为 new_size 字节的新内存块,并将ptr指向的数据拷贝到新内存中,然后释放ptr指向的数据
// 3 分配失败(没有足够的内存),返回NULL,但ptr指向的内存并未释放
int expand(Vec *v) {
    // 顺序表的动态扩容,一般扩容为原空间的2倍
    int extr_size = v->size;
    int *p;
    // 通过动态的减小extr_size值,来提高扩容的可能性
    while (extr_size) {
        p = (int *)realloc(v->data, sizeof(int) * (extr_size + v->size));
        if (p != NULL) break;
        extr_size >>= 1;
    }
    // 扩容失败(没有足够的内存)
    if (p == NULL) return 0;
    v->size += extr_size;
    v->data = p;
    return 1;
}

int insert(Vec *v, int ind, int val) {
    // 判断顺序表是否存在
    if (v == NULL) return 0;
    // 1 位置合法性判断,顺序表必须在[0, v->length]的范围内插入元素
    if (ind < 0 || ind > v->length) return 0;
    // 2 当前顺序表中数据元素是否达到容量上限(size),以此来判断是否需要扩容处理
    if (v->length == v->size) {
        if (!expand(v)) {
            printf(RED("fail to expand!\n"));
        }
        printf(GREEN("success to expand! the size = %d\n"), v->size);
    }
    // 3 将ind后的每一个元素后移(包括ind位置的元素)
    for (int i = v->length; i > ind; i--) {
        v->data[i] = v->data[i - 1];
    }
    // 4 在指定位置插入元素,同时顺序表中的数据元素个数加一
    v->data[ind] = val;
    v->length += 1;
    return 1;
}

int erase(Vec *v, int ind) {
    if (v == NULL) return 0;
    // 1 位置合法性判断,此处必须有等号,因为元素下标是从0开始的
    // 2 此处,隐式包含了顺序表的判空操作
    if (ind < 0 || ind >= v->length) return 0;
    // 3 将ind后的每个元素依次向前移动
    for (int i = ind + 1; i < v->length; i++) {
       v->data[i - 1] = v->data[i];
    }
    // 4 数据元素的个数减一
    v->length -= 1;
    return 1;
}

void clear(Vec *v) {
    if (v == NULL) return ;
    free(v->data);
    free(v);
    return ;
}

void output(Vec *v) {
    if (v == NULL) return ;
    printf("[");
    for (int i = 0; i < v->length; i++) {
        i && printf(", ");
        printf("%d", v->data[i]);
    }
    printf("]\n");
    return ;
}