由strcat函数引发的C语言中数组和指针问题的思考

时间:2022-06-07 14:36:27

问题一

首先,来看一下下面这段代码:

#include <stdio.h>
#include <string.h>
int main() {
char *str = "media";
char *tmp = "aaa";
printf("str: %s\n",str);
strcat(str,tmp);
printf("str: %s\n",str);
return 0;
}

代码打眼儿一看,功能很明显:把str指针指向的字符串和tmp指针指向的字符串连接起来再赋给str指向的字符串。我们把这个程序运行一下,如下图:

由strcat函数引发的C语言中数组和指针问题的思考

报出了段错误,使用cgdb调试一下,发现问题是出在strcat函数处:

由strcat函数引发的C语言中数组和指针问题的思考

感觉很奇怪,就去查找了strcat函数的一些示例,发现几乎所有的strcat的示例都是连接的两个数组类型字符串或者一个数组类型一个指针类型(指针类型指向的字符串一定是接在数组字符串之后)。自己手动测试了一下,把*str改为了str[20],发现程序成功运行:

由strcat函数引发的C语言中数组和指针问题的思考

后经过一系列的文档查阅,得知定义为指针所指向的字符串是常量字符串,只能读取不能写入。运行过程中,指针变量p所指向的内存是分配在堆中的,且只分配了足够其指向的内容的内存。将q连接到p后,自然p是没有其他空间给q了,所以发生了段错误。要连接这样的字符串,得另外开辟一个空间存放连接起来的字符串。如果非要将两个变量定义为指针类型,可以把程序修改为以下形式:

#include <stdio.h>
#include <string.h>
int main() {
char *str = "media";
char *tmp = "aaa";
char *res = (char *)malloc(strlen(str)+strlen(tmp)+1);
printf("str: %s\n",str);
strcat(strcpy(res,str),tmp);
printf("str: %s\n",res);
return 0;
}

得到的结果正确:

由strcat函数引发的C语言中数组和指针问题的思考

问题二

这学期上了一门课,需要在Linux C中完成一个项目。其中有一个功能模块是在指定文件夹目录下递归查找当前目录下的所有文件,并将所有的文件的路径存入一个数组中。其实递归查询当前文件目录下的所有文件这个功能并不难,网上也有很多实现方法。我所遇到的问题又出在了数组和指针的问题上(指针涉及的对内存的操作真的是C的最大难点。。),下面是问题具体描述:

我所要实现的功能是,在main的参数中指定了所要扫描的文件夹,在指定文件夹下扫描所有的文件,并把所扫描到的所有文件的路径存入一个数组中。我使用了dirent.h头文件中定义的结构体,当d_type == 8是文件,d_type == 4时是文件夹。等于4时便递归调用函数实现扫描文件夹下的所有文件,发现一个,printf一个。然后定义了一个全局的char数组指针path来指向所扫描到的文件路径,在main函数下输出path来验证路径是否正确的存入了数组。主要代码如下:

由strcat函数引发的C语言中数组和指针问题的思考

然后我所要扫描的文件夹file下有三个txt文件,分别是1.txt、2.txt、3.txt:

由strcat函数引发的C语言中数组和指针问题的思考

在运行程序的时候,出现了问题:在执行readfilelist函数的时候,可以成功的发现并输出file文件夹下的三个txt文件,可是path中所存放所找到的文件路径似乎并不正确,数组中所有的值都相同,且都是最后一个所找到的文件的路径,如下图所示(path array has following data下面输出的路径是path数组指针中的数据):

由strcat函数引发的C语言中数组和指针问题的思考

很奇怪,在readfilelist中printf一下每一次循环path中的值试试看吧,发现每一次循环输出的path中的值是正确的(如下图#后的输出结果)????????这就相当于,逐步输出path中的值是正确的,在main中重新for循环遍历一下结果就变了,path还是一个全局变量不存在生存期的问题。而且逐步输出的时候数组下标count都是及时++的,如果是递归返回时的问题,不可能下标已经是3了程序还能将数组退到0、1、2位置更改数组中的值吧。这也太奇怪了。。。。

由strcat函数引发的C语言中数组和指针问题的思考

这个结果只能有一种解释:在逐步将文件路径存入数组相应的位置时,数组所有的位置的值同时都被改变了。不过我还是不能理解为什么会发生这样的问题,立马打开cgdb。。

display一下path和局部变量ingpath(ingpath是普通字符数组类型,作用是当文件类型是文件时,将文件路径连接完整,再统一赋值给path),看看他俩的值和地址到底是怎么变化的。

第一次扫描到3.txt文件,将值存入path中,地址后四位为d5f0:

由strcat函数引发的C语言中数组和指针问题的思考

继续执行,又找到了1.txt文件,在操作数组ingpath时出现了问题:还没有执行到给path赋值,只是在对ingpath进行修改操作时,path中的内容也发生了改变:

由strcat函数引发的C语言中数组和指针问题的思考

继续执行观察到给path赋值,发现确实和之前的猜想一样,逐步将文件路径存入数组相应的位置时,数组所有的位置的值同时都被改变了:

由strcat函数引发的C语言中数组和指针问题的思考

并且,所有经过ingpath所给path赋的值的内存地址都是相同的,都是d5f0。至此,破案了:在将数组指针path的地址指向数组变量ingpath时,path就已经绑定ingpath的地址了(和C++11中的引用&用法有些类似),数组变量的内存地址不会发生改变,而且所有对于ingpath的操作也会相应的对path进行操作。path数组指针的每一位存入数据的内存地址都相同,自然所对应的数据就相同,进而path中所有的值都是相同的。

如何对此进行改进呢。我的想法是:把ingpath的类型也改为指针类型,作为局部变量,每一次循环开始时都重新为ingpath指针指向的常量空间重新malloc一下,这样就保证了ingpath指向的内存地址每一次循环都被重新分配而不会相同,进而“解除”了与path所指向内存地址的绑定。这样的话,对ingpath指向的地址中的值进行修改就不会影响到path指向的地址中的值,保证了ingpath顺利存入path的相应位置。

按照这个思路,对代码进行了修改:

由strcat函数引发的C语言中数组和指针问题的思考

果不其然,输出path,正确的输出了所有文件的路径:

由strcat函数引发的C语言中数组和指针问题的思考

总结

一个小问题,只需要修改一行代码就解决了的问题折腾了一天时间(此处,真的想发送一个围笑_)。不过时间没有白折腾,基本搞清楚了指针和数组相关的问题,收获良多,还是很开心的。把这个debug的过程写出来作为一个分享。

最后,敲黑板:指针只是一个内存地址的引用,指向内存地址空间。如果在其他地方更变了这个地址空间里的数据,指针指向该地址空间中的值也会随之改变(废话,不都是一个值么)。