小C语言--词法分析程序

时间:2022-10-10 20:59:54

小C语言文法 
1. <程序>→<main关键字>(){<声明序列><语句序列>}
2. <声明序列>→<声明序列><声明语句>|<声明语句>|<空>
3. <声明语句>→<标识符表>;
4. <标识符表>→<标识符>,<标识符表>|<标识符>
5. <语句序列>→<语句序列><语句>|<语句>
6. <语句>→< if语句>|< while语句>|< for语句>|<复合语句>|<赋值语句>
7. < if语句>→< if关键字>(<表达式>)<复合语句>|(<表达式>)<复合语句>< else关键字><复合语句>
8. < while语句>→< while关键字>(<表达式>)<复合语句>
9. < for语句>→< for关键字>(<表达式>;<表达式>;<表达式>)<复合语句>
10. <复合语句>→{<语句序列>}
11. <赋值语句>→<表达式>;
12. <表达式>→<标识符>=<算数表达式>|<布尔表达式>
13. <布尔表达式>→<算数表达式> |<算数表达式><关系运算符><算数表达式>
14. <关系运算符>→>|<|>=|<=|==|!=
15. <算数表达式>→<算数表达式>+<项>|<算数表达式>-<项>|<项>
16. <项>→<项>*<因子>|<项>/<因子>|<因子>
17. <因子>→<标识符>|<无符号整数>|(<算数表达式>)
18. <标识符>→<字母>|<标识符><字母>|<标识符><数字>
19. <无符号整数>→<数字>|<无符号整数><数字>
20. <字母>→a|b|…|z|A|B|…|Z
21. <数字>→0|1|2|3|4|5|6|7|8|9

22. < main关键字>→main
23. < if关键字>→if
24. < else关键字>→else
25. < for关键字>→for
26. < while关键字>→while
27. < int关键字>→int

 

每行单词数不超过10个
小C语言文法如上,现在我们对小C语言写的一个源程序进行词法分析,分析出关键字、自定义标识符、整数、界符
和运算符。
关键字:main if else for while int
自定义标识符:除关键字外的标识符
整数:无符号整数
界符:{ } ( ) , ;
运算符:= + - * / < <= > >= == !=

Input

输入一个小C语言源程序,源程序长度不超过2000个字符,保证输入合法。

Output

按照源程序中单词出现顺序输出,输出二元组形式的单词串。

(单词种类,单词值)

单词一共5个种类:

关键字:用keyword表示
自定义标识符:用identifier表示
整数:用integer表示
界符:用boundary表示
运算符:用operator表示

每种单词值用该单词的符号串表示。

Sample

Input 

main() 
{
int a, b;
if(a == 10)
{
a = b;
}
}

Output 

(keyword,main)
(boundary,()
(boundary,))
(boundary,{)
(keyword,int)
(identifier,a)
(boundary,,)
(identifier,b)
(boundary,;)
(keyword,if)
(boundary,()
(identifier,a)
(operator,==)
(integer,10)
(boundary,))
(boundary,{)
(identifier,a)
(operator,=)
(identifier,b)
(boundary,;)
(boundary,})
(boundary,})
//遇到界符直接判断
//在遇到数字开头时,一直判断到非数字,则这一段数字表示整数;
//遇到字母或下划线开头的,一直判断到非数字、字母、下划线,再将这段字符串与题目中的6个关键字比较,然后判断这是关键字还是自定义的标识符
//最后剩下的就是运算符了,若下一个输入的字符是“=”,则一定是两个字节的运算符,否则就是一个的
#include<bits/stdc++.h>
using namespace std;
string key[6]={"main","if","else","while","int","for"};
void show(string s)
{
if(s=="")
return;
if(isdigit(s[0]))//判断输入字符是否是介于0~9的数字,是则返回非零值,否则返回零
{
cout<<"(integer,"<<s<<")"<<endl;
return;
}

for(int i=0;i<6;i++)
{
if(s==key[i])
{
cout<<"(keyword,"<<s<<")"<<endl;
return;
}
}
cout<<"(identifier,"<<s<<")"<<endl;
}
int main()
{
string s;
while(cin>>s)
{
int len;
int i=0;
len=s.length();
string a="";//a为空字符串
for(i=0;i<len;i++)
{
if(s[i]=='='||s[i]=='+'||s[i]=='-'||s[i]=='*'||s[i]=='/'||s[i]=='>'||s[i]=='<'||s[i]=='!')
{
show(a);
a="";
if(s[i+1]=='=')
{
cout<<"(operator,"<<s[i]<<s[i+1]<<")"<<endl;
i++;
}
else
{
cout<<"(operator,"<<s[i]<<")"<<endl;
}

}

else if( s[i]=='('||s[i]==')'||s[i]=='{'||s[i]=='}'||s[i]==','||s[i]==';' )
{
show(a);
a="";
cout<<"(boundary,"<<s[i]<<")"<<endl;
}
else
a=a+s[i];
}
show(a);

}
return 0;

}