scanf,sscanf利用format跳过干扰的空格

时间:2023-03-08 22:50:43
scanf,sscanf利用format跳过干扰的空格

scanf,sscanf利用format跳过干扰的空格

用了一点时间做读取配置部分的代码,希望一次记录上读取N个数据,

希望读取的格式就是一个IP地址加上端口号,希望把IP地址读取到4个短整数里面,端口号读取到另外的一个短整数。文字格式类似“192.120.1.120#8080”,但结果发现因为为了对齐,中间的空格干扰了读取。

读取的输入可能是这样“192.120.1.120   #     8080”,甚至可能是 " 192 .168 . 1 .120 # 8080 "

郁闷。google +MSDN,发现其实可以就用scanf,sscanf绕过。最后选择的format 是"%hu . %hu . %hu . %hu # %hu",请注意中间的空格。

参考文档:

http://www.cplusplus.com/reference/cstdio/scanf/   此文档写的很细致。

http://linux.die.net/man/3/sscanf

另外发现scanf 还具有比较简单的正则能力。处理很多格式化内容其实还是挺方便的。(原来土鳖都是过滤掉空格的。)

下面是自己测试自己测试的例子,还走了一下弯路,先以为用正则可以搞点,结果发现正则的写法还是不如空格过滤好用。

scanf的format字符串:

空格:也会同样去过滤输入字符串的空格,而且会持续过滤,直到不是空格为止。(空格也包括tab,回车等)

其他字符,(不包括%):会同样在输入字符里面跳过想用的字符。

%:控制输入一个字段,根据后面的长度,控制符读取数据内容。比如%d等。

%*:会跳过一个输入字段,比如sscanf("123  456","%*d %d",&data); data读取会是456;

%[0-9]:贪婪的读取0-9的字符,作为一个string读取

%[^0-9]:贪婪的读取非0-9的字符,作为一个string读取

 #include <iostream>
#include <stdio.h> using namespace std; int main()
{
int ret = ;
short ip_addr[];
unsigned short port; cout <<"============================================="<<std::endl;
port = ip_addr[] = ip_addr[] = ip_addr[] = ip_addr[] = ;
ret = sscanf("192.168.1.120#8080",
"%hu.%hu.%hu.%hu#%hu",
&ip_addr[],
&ip_addr[],
&ip_addr[],
&ip_addr[],
&port
);
//ret 5, IP 192 168 1 120Port 8080 读取正确
cout <<"ret " <<ret <<
" IP "<<ip_addr[] <<" "<<ip_addr[] <<" "<<ip_addr[] <<" "<<ip_addr[] <<" Port "<< port << endl; port = ip_addr[] = ip_addr[] = ip_addr[] = ip_addr[] = ; ret = sscanf(" 192 .168 . 1 .120 # 8080",
"%hu.%hu.%hu.%hu#%hu",
&ip_addr[],
&ip_addr[],
&ip_addr[],
&ip_addr[],
&port
);
//ret 1, IP 192 0 0 0Port 0 读取错误
cout <<"ret " <<ret <<
" IP "<<ip_addr[] <<" "<<ip_addr[] <<" "<<ip_addr[] <<" "<<ip_addr[] <<" Port "<< port << endl; cout <<"============================================="<<std::endl; port = ip_addr[] = ip_addr[] = ip_addr[] = ip_addr[] = ;
ret = sscanf("192.168.1.120#8080",
"%hu%*[^.].%hu%*[^.].%hu%*[^.].%hu%*[^#]#%hu",
&ip_addr[],
&ip_addr[],
&ip_addr[],
&ip_addr[],
&port
);
//ret 1 IP 192 0 0 0Port 0 读取错误,因为%*[^.] 是要匹配一个任何一个非.的字符。但192后面就是.
cout <<"ret " <<ret <<
" IP "<<ip_addr[] <<" "<<ip_addr[] <<" "<<ip_addr[] <<" "<<ip_addr[] <<" Port "<< port << endl; port = ip_addr[] = ip_addr[] = ip_addr[] = ip_addr[] = ;
ret = sscanf(" 192 .168 . 1 .120 # 8080",
"%hu%*[^.].%hu%*[^.].%hu%*[^.].%hu%*[^#]#%hu",
&ip_addr[],
&ip_addr[],
&ip_addr[],
&ip_addr[],
&port
);
//ret 5, IP 192 168 1 120Port 8080 读取正确
cout <<"ret " <<ret <<
" IP "<<ip_addr[] <<" "<<ip_addr[] <<" "<<ip_addr[] <<" "<<ip_addr[] <<" Port "<< port << endl; cout <<"============================================="<<std::endl; port = ip_addr[] = ip_addr[] = ip_addr[] = ip_addr[] = ;
ret = sscanf("192.168.1.120#8080",
"%hu . %hu . %hu . %hu # %hu",
&ip_addr[],
&ip_addr[],
&ip_addr[],
&ip_addr[],
&port
);
//ret 5, IP 192 168 1 120Port 8080 读取正确
cout <<"ret " <<ret <<
" IP "<<ip_addr[] <<" "<<ip_addr[] <<" "<<ip_addr[] <<" "<<ip_addr[] <<" Port "<< port << endl; port = ip_addr[] = ip_addr[] = ip_addr[] = ip_addr[] = ;
ret = sscanf(" 192 .168 . 1 .120 # 8080",
"%hu . %hu . %hu . %hu # %hu",
&ip_addr[],
&ip_addr[],
&ip_addr[],
&ip_addr[],
&port
);
//ret 5, IP 192 168 1 120Port 8080 读取正确,format中的空格的匹配输入字符串的任意空格,很好用
cout <<"ret " <<ret <<
" IP "<<ip_addr[] <<" "<<ip_addr[] <<" "<<ip_addr[] <<" "<<ip_addr[] <<" Port "<< port << endl; return ;
}