Linux C 字符串输入函数 gets()、fgets()、scanf() 详解

时间:2022-10-26 17:00:58

一、gets() 函数详解

gets()函数用来从 标准输入设备(键盘)读取字符串直到 回车结束,但回车符('\n')不属于这个字符串

调用格式为:

gets(str);

其中str为字符串变量(字符串数组名或字符串指针)。

gets(str) 函数与 scanf("%s", &str) 相似,但不完全相同,使用 scanf("%s", &str) 函数输入字符串时存在一个问题,就是如果输入了 空格 会认为输入字符串结束。

空格后的字符将作为下一个输入项处理, 但 gets() 函数将接收输入的整个字符串直到 回车 为止。

#include <stdio.h>
#include <stdlib.h> int main(int argc, char **argv)
{
char s[20], *f; printf("input sth\n");
gets(s); // 等待输入字符串直到回车结束
puts(s); // 将输入的字符串输出 puts("input sth\n");
f = malloc(sizeof(f));
gets(f);
puts(f);
free(f); return 0;
}

gets()函数详解 和 缺陷

1、基本信息

原型:

char *gets( char *buffer);

功能描述:

gets()函数从标准输入中读取一行文本,并存储于作为参数传递给它的数组中。一行文本由一串字符组成,以一个换行符('\n')结尾。在返回之前,gets()函数丢弃换行符('\n'),取而代之的是以'\0'结尾。

返回值:

读取成功,函数返回与buffer相同的指针。读入过程中遇到EOF或发生错误,函数返回NULL指针。当返回值为NULL指针时可以用 feof() 和 ferror() 来判断函数是遇到EOF还是发生错误。

例如:

char str[10];

if (gets(str) != NULL) // Danger!
{
printf("str = %s\n", str);
}

2、函数缺陷

gets函数没有限制它所读取长度,程序员应该保证buffer有足够的空间,否则buffer可能无法容纳gets所读取的内容,从而导致堆栈溢出。如果溢出,多出来的字符将被写入到堆栈中,这就覆盖了堆栈原先的内容,破坏一个或多个不相关变量的值。

Linux C 字符串输入函数 gets()、fgets()、scanf() 详解

图1 溢出提示

为了安全起见,可以使用 gets_s() 函数。


二、fgets() 函数详解

fgets()函数,从流中读一行或指定个字符

1、基本信息

原型:

char *fgets(char *s, int n, FILE *stream);

功能描述:

从流中读入 n-1 个字符放入 s 为起始地址的空间内。如果在未读满 n-1 个字符之时,已读到一个换行符('\n')或一个EOF(文件结束标志),则结束本次读操作,读入的字符串中最后包含读到的换行符('\n')。因此,确切地说,调用 fgets() 函数时,最多只能读入 n-1 个字符。读入结束后,系统将自动在最后加 '\0',并以 s 作为函数值返回。

形参注释:

*s:结果数据的首地址;

n-1:一次读入数据块的长度,其默认值为1k,即1024;

stream:文件指针   

例:如果一个文件的当前位置的文本如下

Love ,I Have

But ........

如果用 

fgets(str1, 4, file1); 

则执行后 str1="Lov",读取了 4-1=3 个字符,

而如果用 

fgets(str1, 23, file1); 

则执行后 str="Love ,I Have",读取了一行(包括行尾的'\n', 并自动加上字符串结束符'\0')。

2、特别说明

该函数从stream所指的文件中读取以'\n'结尾的一行(包括'\n'在内)存到缓冲区s中,并且在该行末尾添加一个 '\0'组成完整的字符串。

如果文件中的一行太长,fgets从文件中读了 n-1 个字符还没有读到 '\n',就把已经读到的 n-1 个字符和一个 '\0' 字符存入缓冲区,文件中剩下的半行可以在下次调用 fgets() 时继续读。

如果一次 fgets() 调用在读入若干个字符后到达文件末尾,则将已读到的字符串加上 '\0' 存入缓冲区并返回,如果再次调用 fgets() 则返回 NULL,可以据此判断是否读到文件末尾。

注意:

对于 fgets() 来说,'\n' 是一个特别的字符,而 '\0' 并无任何特别之处,如果读到 '\0'就当作普通字符读入。

如果文件中存在 '\0' 字符(或者说0x00字节),调用fgets() 之后就无法判断缓冲区中的 '\0' 究竟是从文件读上来的字符还是由 fgets() 自动添加的结束符,所以 fgets() 只适合读文本文件而不适合读二进制文件,并且文本文件中的所有字符都应该是可见字符,不能有 '\0'


三、scanf() 函数详解

1、基本信息

函数名:scanf

功  能:执行格式化输入

用  法:int scanf(char *format[,argument,...]);

scanf()函数是通用终端格式化输入函数,它从标准输入设备(键盘) 读取输入的信息。可以读入任何固有类型的数据并自动把数值变换成适当的机内格式。

其调用格式为:

scanf("<格式化字符串>", <地址表>);

scanf()函数返回成功赋值的数据项数,出错时则返回 EOF。

其 控制串 由三类字符构成:

  • 格式化说明符;
  • 空白符;
  • 非空白符;

(A)格式化说明符

格式字符           说明

%a                 读入一个浮点值(仅C99有效) 
%A                 同上
%c                 读入一个字符
%d                 读入十进制整数
%i                 读入十进制,八进制,十六进制整数
%o                 读入八进制整数
%x                 读入十六进制整数
%X                 同上
%c                 读入一个字符
%s                 读入一个字符串
%f                 读入一个浮点数
%F                 同上
%e                 同上
%E                 同上
%g                 同上
%G                 同上
%p                 读入一个指针
%u                 读入一个无符号十进制整数
%n                 至此已读入值的等价字符数
%[]                扫描字符集合
%%                 读%符号

附加格式说明字符表

修饰符                       说明

L/l 长度修饰符               输入"长"数据
h 长度修饰符                 输入"短"数据
W 整型常数                   指定输入数据所占宽度
* 星号                       空读一个数据 
hh,ll同上h,l但仅对C99有效。

(B)空白字符

空白字符会使scanf()函数在读操作中略去输入中的一个或多个空白字符,空白符可以是space,tab,newline等等,直到第一个非空白符出现为止。

(C)非空白字符

一个非空白字符会使scanf()函数在读入时剔除掉与这个非空白字符相同的字符。

注:scanf()控制串知识就介绍到这里(应该比较齐全了^_^),如有遗漏下次补上。下面将结合实际例程,一一阐述.

2、应用举例

例1.

#include "stdio.h" 

int main(int argc, char **argv)
{ int a, b, c; scanf("%d%d%d", &a, &b, &c);
printf("%d,%d,%d\n", a, b, c); return 0;
}

运行时按如下方式输入三个值:

3□4□5 ↙(输入a,b,c的值)

3,4,5 (printf输出的a,b,c的值)

(1)&a、&b、&c中的&是地址运算符,分别获得这三个变量的内存地址。

(2)"%d%d%d"是按十进值格式输入三个数值。输入时,在两个数据之间可以用一个或多个 空格、tab键、回车键 分隔。

以下是合法输入方式:

① 3□□4□□□□5↙
② 3↙
   4□5↙
③ 3(tab键)4↙
   5↙

例2.

#include "stdio.h" 

int main(int argc, char **argv)
{ int a, b, c; scanf("%d,%d,%d", &a, &b, &c);
printf("%d,%d,%d\n", a, b, c); return 0;
}

运行时按如下方式输入三个值:

3,4,5 ↙(输入a,b,c的值)

或者

3,□4,□5 ↙(输入a,b,c的值)

3,□□□4,□5 ↙(输入a,b,c的值)

......

都是合法的,但是","一定要跟在数字后面,如:

3□,4,□5 ↙就非法了,程序出错。(解决方法与原因后面讲)

3、注意事项

(1)sacnf()中的变量必须使用地址。

int a, b;
scanf("%d%d", a, b); // 错误
scanf("%d%d", &a, &b);

(2)scanf()的格式控制串可以使用其它非空白字符,但在输入时必须输入这些字符。

例:

scanf("%d,%d", &a, &b); 

输入: 3,4 ↙(逗号与"%d,%d"中的逗号对应)

scanf("a=%d,b=%d", &a, &b);

输入: a=3,b=4 ↙("a=","b=",逗号与"%d,%d"中的"a=","b="及逗号对应)

(3)在用"%c"输入时,空格和“转义字符”均作为有效字符。

例:

scanf("%c%c%c", &c1, &c2, &c3); 

输入:a□b□c↙

结果:a→c1,□→c2,b→c3 (其余被丢弃)

scanf()函数接收输入数据时,遇以下情况结束一个数据的输入:(不是结束该scanf函数,scanf函数仅在每一个数据域均有数据,并按回车后结束)。

① 遇空格、“回车”、“跳格”键。
② 遇宽度结束。
③ 遇非法输入。

4、常见问题

问题一:scanf()函数不能正确接受有空格的字符串?如: I love you!

#include "stdio.h" 

int main(int argc, char **argv)
{ char str[80]; scanf("%s", str);
printf("%s", str); return 0;
}

输入:I live you!

输出:I

scanf()函数接收输入数据时,遇以下情况结束一个数据的输入:(不是结束该scanf函数,scanf函数仅在每一个数据域均有数据,并按回车后结束)。

① 遇空格、“回车”、“跳格”键。
② 遇宽度结束。
③ 遇非法输入。

所以,上述程序并不能达到预期目的,scanf()扫描到"I"后面的空格就认为对str的赋值结束,并忽略后面的"love you!"。这里要注意是"love you!"还在键盘缓冲区(关于这个问题,网上我所见的说法都是如此,但是,我经过调试发现,其实这时缓冲区字符串首尾指针已经相等了,也就是说缓冲区清空了,scanf()函数应该只是扫描stdin流,这个残存信息是在stdin中)。我们改动一下上面的程序来验证一下:

#include <unistd.h>
#include "stdio.h"  int main(int argc, char **argv)
{
char str[80];
char str1[80];
char str2[80]; scanf("%s", str); // 此处输入:I love you! 
printf("%s", str); sleep(5); // 这里等待5秒, 告诉你程序运行到什么地方 scanf("%s", str1); // 这两句无需你再输入, 是对键盘盘缓冲区再扫描  
scanf("%s", str2); // 这两句无需你再输入, 是对键盘盘缓冲区再扫描
printf("\n%s", str1);
printf("\n%s", str2); return 0;
}

输入:I love you!

输出:I
      love
      you!

好了,原因知道了,那么scanf()函数能不能完成这个任务?回答是:能!别忘了scanf()函数还有一个 %[] 格式控制符(如果对%[]不了解的请查看本文的上篇),请看下面的程序:

#include <unistd.h>
#include "stdio.h"  int main(int argc, char **argv)
{
char string[50]; //scanf("%s", string); //不能接收空格符
scanf("%[^\n]", string);
printf("%s\n", string); return 0;
}

问题二:键盘缓冲区残余信息问题

#include "stdio.h"

int main(int argc, char **argv)
{
int a;
char c; do
{
scanf("%d", &a);
scanf("%c", &c);
printf("a=%d c=%c\n", a, c);
//printf("c=%d\n", c);
}
while (c != 'N'); return 0;
}

scanf("%c", &c);这句不能正常接收字符,什么原因呢?我们用 printf("c=%d\n", c); 将C用int表示出来,启用 printf("c=%d\n", c); 这一句,看看 scanf() 函数赋给c到底是什么,结果是 c=10,ASCII值为10是什么?换行即\n。对了,我们每击打一下"Enter"键,向键盘缓冲区发去一个“回车”(\r),一个“换行"(\n),在这里\r被 scanf() 函数处理掉了(姑且这么认为吧^_^),而\n被scanf()函数“错误”地赋给了c。

解决办法:

可以在两个 scanf() 函数之后加个 fflush(stdin);,还有加 getch(); getchar(); 也可以,但是要视具体 scanf() 语句加那个,这里就不分析了,读者自己去摸索吧。但是加fflush(stdin);不管什么情况都可行。

函数名: fflush

功  能: 清除一个流

用  法: int fflush(FILE *stream);

#include "stdio.h"

int main(int argc, char **argv)
{
int a;
char c; do
{
scanf("%d", &a);
fflush(stdin);
scanf("%c", &c);
fflush(stdin);
printf("a=%d c=%c\n", a, c);
}
while (c != 'N'); return 0;
}

这里再给一个用“空格符”来处理缓冲区残余信息的示例:

运行出错的程序:

#include <stdio.h>

int main(int argc, char **argv)
{
int i;
char j;
for (i = 0; i < 10; i++)
{
scanf("%c", &j); // 这里%前没有空格
} return 0;
}

使用了空格控制符后:

#include <stdio.h>

int main(int argc, char **argv)
{
int i;
char j;
for (i = 0; i < 10; i++)
{
scanf(" %c", &j); // 注意这里%前有个空格
} return 0;
}

可以运行看看两个程序有什么不同。

问题三:如何处理scanf()函数误输入造成程序死锁或出错?

#include <stdio.h>

int main(int argc, char **argv)
{
int a, b, c; // 计算a+b scanf("%d,%d", &a, &b);
c = a + b;
printf("%d+%d=%d", a, b, c); return 0;
}

如上程序,如果正确输入a,b的值,那么没什么问题,但是,你不能保证使用者每一次都能正确输入,一旦输入了错误的类型,你的程序不是死锁,就是得到一个错误的结果,呵呵,这可能所有人都遇到过的问题吧?

解决方法:

scanf()函数执行成功时的返回值是成功读取的变量数,也就是说,你这个scanf()函数有几个变量,如果scanf()函数全部正常读取,它就返回几。但这里还要注意另一个问题,如果输入了非法数据,键盘缓冲区就可能还个有残余信息问题。

正确的例程:

#include <stdio.h>

int main(int argc, char **argv)
{
int a, b, c; // 计算a+b while (scanf("%d,%d", &a, &b) != 2)
{
fflush(stdin);
}
c = a + b;
printf("%d+%d=%d", a, b, c); return 0;
}