C指针及其运算

时间:2023-03-09 11:03:39

内存地址

以整型加法为例,我们来看看在计算机内部,CPU(*处理器)是如何配合其他硬件进行计算的。

CPU与内存协同工作

CPU由三部分构成:

  • 算术、逻辑单元:对数据执行运算(例如加法、减法)的电路。
  • 控制单元:协调机器活动的电路。
  • 寄存器组 :数据临时存储。

数据几乎都存储在内存上,仅有当前正在处理的数据,才放到CPU的寄存器组上,等待CPU进行计算。CPU将数据计算完毕后,再存储到内存中。数据通过数据总线,在CPU和内存上进行传输。 C指针及其运算

访问内存中的“房间”

只有正在被处理的数据才会被放到CPU的寄存器上,等待CPU进行计算,CPU将数据计算完毕后,再存储到内存中。所以,内存才是数据的大本营。 我们知道,计算机通过晶体管的开关状态来记录数据。它们通常8个编为一组,我们称之为字节。既然内存需要存储数据,内存上必然有非常多的这种8个开关组成的编组。 我们可以把这种编组看作居住数据的“房间”,而为了方便地找到这些“房间”,每个“房间”均有一个编号。第一个“房间”编号从0开始,此后依次加1。 C指针及其运算 我们把“房间号”,称之为内存地址

基础数据类型怎样居住“房间”

以int为例,我们有以下两种表达方式:

  • 列举所有的房号:301,302,303,304。
  • 首房间及房间数:从301开始的4个房间。

计算机使用第二种方式记录一个数据对象在内存中的存储位置。 我们把第一个“房间”的“房间号”,称为这个数据对象的首地址。那么数据对象需要的房间数量,就是它所占用的存储空间大小。

因此,记录一个数据对象在内存中的存储位置,需要两个信息:

  • 数据对象的首地址。
  • 数据对象占用存储空间大小。

指针数据类型

取地址运算符 &

取地址运算符是一个一元运算符,写在一个数据对象的左边,可以获取一个数据对象的首地址和所需存储空间大小。

声明指针类型的变量

int n;
int* pn = &n;
char c;
char* c = &c;

int* pn声明一个保存了int类型的首地址和大小的变量。 char* pc声明一个保存了char类型的首地址和大小的变量。 变量pn存储了变量n的首地址与大小,变量pc存储了变量c的首地址与大小。通过pn和pc可以在内存中找到变量n和c。

定义

设一个数据对象为x,设另一个数据对象为p。p存储了x的首地址和所占空间大小。那么,p称之为x的指针,或者说p指向x。 对于上面的代码:

  • pn被称作n的指针,或者说pn指向n。
  • pc被称作c的指针,或者说pc指向c。
    int* pn; // 将空格放在变量旁
    int *pn; // 将空格放在类型旁
    int*pn; // 不用空格

另外,声明指针变量时,将空格放在变量旁或者将空格放在类型旁,甚至不用空格。这3种写法都是可以的

指针类型

指针类型通过值来保存目标数据对象的首地址,类型本身标记目标数据对象的空间大小。

首地址

指针类型的值就是目标数据对象的首地址

空间大小

C语言中通过不同的指针类型来标记目标数据对象的空间大小

使用指针

取值运算符 *

取值运算符是一个一元运算符,写在一个指针的左边,可以根据指针中存储的首地址和空间大小找到目标数据对象。 虽然它和乘法运算符很像,但是,它是一个一元运算符,仅需要一个操作对象。 除了通过指针访问所指向的数据对象,也可以通过指针修改所指向的数据对象

指针类型的大小

不同的编译器或编译配置可以让编译器生成32位或64位的程序,有时候被称作x86或x64。

  • 32位程序可以访问从0到2的32次方的地址范围。
  • 64位程序可以访问从0到2的64次方的地址范围。

如果指针类型的大小为4字节,使用%u作为printf的占位符是合适的。但是指针类型的大小为8字节时,使用%u有可能不能完全打印地址,可以使用长度指示符,将长度加长到8字节,例如%llu。 占位符%p是指针类型专用的占位符,32位或64位程序使用它均能保证打印的结果正确。不过,它通常是以十六进制显示的。

强制转换指针类型

#include <stdio.h>
int main()
{
    int n = 1431655765;
    int* pn = &n;
    char* pc = (char*)pn;
    printf("pn=%u\n", pn);
    printf("pc=%u\n", pc);
    printf("n=%d\n", n);
    printf("*pn=%d\n", *pn);
    printf("*pc=%d\n", *pc);
    return 0;
}

变量pn为指向int类型的指针。 变量pc为指向char类型的指针。 虽然变量pn与pc不能在赋值时自动转换。但是,使用强制转换可以将pn转换为char*后赋值给pc。 赋值后,pn与pc均存储了n的首地址,均打印出了同样的首地址。但是,C语言使用不同的指针类型标识目标对象的空间大小。

pn=982514036
pc=982514036
n=1431655765
*pn=1431655765
*pc=85

pn为int*类型,pn表达式会从首地址开始处取sizoef(int)字节,其转换成int类型作为表达式结果。因此,结果为1431655765。 pc为char类型,*pc表达式会从首地址开始处取sizoef(char)字节,将其转换成char类型作为表达式结果。因此,结果为85。 C指针及其运算

指针运算

一个数据对象的内存位置有两个重要信息:

  • 数据对象的首地址。
  • 数据对象占用存储空间大小。

指针类型通过下面的方式,存储这两个重要信息。

  • 指针类型通过值来保存目标数据对象的首地址。
  • 类型本身标记目标数据对象的空间大小。

指针类型与整型进行加减

指针类型加 n 后。其首地址向后移动n*步长 字节。 指针类型减 n 后。其首地址向前移动n*步长 字节。

#include <stdio.h>
int main()
{
	char* pc;
	short* ps;
	int* pn;
	long* pl;
	long long* pll;
	float* pf;
	double* pd;
	// 现将整型转换为对应的指针类型再赋值
	pc = (char*)100;
	ps = (short*)100;
	pn = (int*)100;
	pl = (long*)100;
	pll = (long long*)100;
	pf = (float*)100;
	pd = (double*)100;
	pc = pc + 1;
	ps = ps + 1;
	pn = pn + 1;
	pl = pl + 1;
	pll = pll + 1;
	pf = pf + 1;
	pd = pd + 1;
	printf("pc=%u\n", pc);
	printf("ps=%u\n", ps);
	printf("pn=%u\n", pn);
	printf("pl=%u\n", pl);
	printf("pll=%u\n", pll);
	printf("pf=%u\n", pf);
	printf("pd=%u\n", pd);
	return 0;
}

所有的指针内保存的首地址一开始均为100,加1后,现在变成了不同的值。 与初始值相比,分别移动了:1、2、4、4、8、4、8。 这些数值分别是对应的目标数据对象的空间大小。 指针类型加1后,将首地址向后移动了sizeof(目标数据对象)字节。

应用指针类型与整型加减

#include <stdio.h>
int main()
{
	int n1;
	int n2;
	int n3;
	int n4;
	printf("&n1=%d\n", &n1);
	printf("&n2=%d\n", &n2);
	printf("&n3=%d\n", &n3);
	printf("&n4=%d\n", &n4);
	putchar('\n');
	// 获取n1的首地址
	int* p = &n1;
	printf("p = %d\n", p);
	printf("p - 1 = %d\n", p - 1);
	printf("p - 2 = %d\n", p - 2);
	printf("p - 3 = %d\n", p - 3);
	putchar('\n');
	// 给n1到n4赋值
	*p = 111; // p指向n1
	*(p - 1) = 222; // p - 1后前后移动4字节,现在指向n2
	*(p - 2) = 333; // p - 2后前后移动8字节,现在指向n3
	*(p - 3) = 444; // p - 3后前后移动12字节,现在指向n4
	printf("n1=%d\n", n1);
	printf("n2=%d\n", n2);
	printf("n3=%d\n", n3);
	printf("n4=%d\n", n4);
	return 0;
}
  • 表达式 p - 1 必须先被括号包裹,再使用取值运算符*。 这是因为**取值运算符_的优先级高于算术运算符。_ 我们需要先让首地址移动,再进行取值操作。 *若不使用括号, p 会先被取值,之后值再被加1。
  • 32位应使用%u,64位使用%llu
    • %d可能出现负号

这串代码是有问题的

函数内声明的变量在内存中不一定是首尾相接的。受到内存对齐的影响,它们有可能不连续,导致崩溃。 但是,数组可以保证各元素在内存中首尾相接,各元素连续分布在内存上。所以,C语言中可以使用指针与整型加减运算访问和修改数组元素。

同类型指针减法运算

sizeof(目标数据对象) 被称作步长。 指针类型与指针类型相减后,其结果为两首地址差值除以步长。

其他类型的指针运算

上面我们介绍了两种有指针类型参数的运算:

  • 指针类型与整型加减。
  • 同类型的指针相减。

它们的运算结果都在内存上拥有实际的意义。 还有另外几种运算:

  • 指针类型与整型进行乘除运算。
  • 同类型的指针相加。
  • 同类型的指针乘除。

这些运算结果都没有实际意义,在C语言中无法通过编译。