C指针原理教程之编译原理-小型计算器实现

时间:2022-11-12 12:39:05

1、打开cygwin,进入home目录,home目录在WINDOWS系统的cygwin安装目录映射为home目录。

2、首先,在home目录中新建文件夹,在文件夹中放置如下内容的test1.l

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
/*统计字数*/
 
%{
 
int chars=0;
 
int words=0;
 
int lines=0;
 
%}
 
%%
 
[a-zA-Z]+ {words++;chars+=strlen(yytext);}
 
\n {chars++;lines++;}
 
.  {chars++;}
 
%%
 
main(int argc,char**argv)
 
{
 
  yylex();
 
  printf("%d%d%d\n",lines,words,chars);
 
}

然后调用flex生成词法分析器

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Administrator@2012-20121224HD /home/flexlinux
 
$ cd /home
 
Administrator@2012-20121224HD /home
 
$ cd flexlinux
 
Administrator@2012-20121224HD /home/flexlinux
 
$ flex test1.l
 
Administrator@2012-20121224HD /home/flexlinux
 
$

可以看到目录中的lex.yy.c就是刚生成的C源码,可分析词法。

?
1
2
3
4
5
Administrator@2012-20121224HD /home/flexlinux
 
$ ls
 
lex.yy.c test1.l

二、flex和bison联合工作

1 、我们开始构造一个计算器程序。

创建flex代码

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
/*计算器*/
 
%{
 
enum yytokentype{
 
   NUMBER=258,
 
 ADD=259,
 
 SUB=260,
 
 MUL=261,
 
 DIV=262,
 
 ABS=263,
 
 EOL=264
 
};
 
int yylval;
 
%}
 
%%
 
"+"  {return ADD;}
 
"-"  {return SUB;}
 
"*"  {return MUL;}
 
"/"  {return DIV;}
 
"|"  {return ABS;}
 
[0-9]+ {yylval=atoi(yytext);return NUMBER;}
 
\n {return EOL;}
 
[ \t] {/*空白忽略*/}
 
. {printf("非法字符 %c\n",*yytext);}
 
%%
 
main(int argc,char**argv)
 
{
 
  int tok;
 
  while(tok=yylex()){
 
   printf("%d",tok);
 
 if (tok==NUMBER) printf("=%d\n",yylval);
 
 else printf("\n");
 
  }
 
}

2、编译

?
1
2
3
4
5
6
7
Administrator@2012-20121224HD /home/flexlinux
 
$ flex test2.l
 
Administrator@2012-20121224HD /home/flexlinux
 
$ gcc lex.yy.c -lfl

3、运行

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
Administrator@2012-20121224HD /home/flexlinux
 
$ ./a
 
- 12 66
 
260
 
258=12
 
258=66
 
264
 
Administrator@2012-20121224HD /home/flexlinux
 
$ ./a
 
/ 56 2 + |32
 
262
 
258=56
 
258=2
 
259
 
263
 
258=32
 
264
 
Administrator@2012-20121224HD /home/flexlinux
 
$

(2)计算器的BISON程序

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
%{
#include <stdio.h>
%}
 
%token NUMBER
%token ADD SUB MUL DIV ABS
%token EOL
 
%%
 
calclist:/**/
 |calclist exp EOL{printf ("=%d\n",$2);}
 ;
 
exp:factor {$$ = $1;}
 |exp ADD factor{$$=$1+$3;}
 |exp SUB factor{$$=$1-$3;}
 ;
 
factor:term {$$=$1;}
 |factor MUL term{$$=$1*$3;}
 |factor DIV term{$$=$1/$3;}
 ;
term:NUMBER {$$=$1;}
 |ABS term {$$=$2>=0?$2:-$2;}
 ;
%%
main(int argc,char **argv){
yyparse();
}
yyerror(char *s)
{
 fprintf(stderr,"error:%s\n",s);
}
$ bison -d test2.y
t$ ls
 
test2.tab.c test2.tab.h test2.y test2.y~

然后,修改刚才的flex文件,将其命名为test21.l

test2.tab.h中包含了记号编号的定义和yylval的定义,因此,将其第一部分的相关定义删除,并改为:

/计算器/

%{

  #include "test2.tab.h"

%}

然后删除,其第三部分的main函数。

最后,进行编译。

?
1
2
3
4
5
bison -d test2.y
 
flex test21.l
 
gcc test2.tab.c lex.yy.c -lfl

可以测试一下

?
1
2
3
4
5
6
7
8
9
root@myhaspl:~# ./a.out
 
12 + 36 * 2
 
=84
 
12 / 6 + 2 * 3
 
=8

(2)扩充计算器

加入对括号和注释的支持,

首先修改flex文件,在第二部分加入更多的词法规则(对于注释直接忽略):

"("   {return LEFTBRACKET;}

")"   {return RIGHTBRACKET;}

"#". /忽略注释*/

然后,修改bison文件,在第二部分加入更多的语法规则:

term:NUMBER {$$=$1;}

  |ABS term {$$=$2>=0?$2:-$2;}

  |LEFTBRACKET exp RIGHTBRACKET {$$=$2;}

  ;

我们的注释以“#”表示

测试结果

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
myhaspl@myhaspl:~/flex_bison/2$ make
 
bison -d calculator.y
 
flex calculator.l
 
gcc calculator.tab.c lex.yy.c -lfl
 
myhaspl@myhaspl:~/flex_bison/2$ ls
 
a.out     calculator.tab.c calculator.y makefile
 
calculator.l calculator.tab.h lex.yy.c
 
myhaspl@myhaspl:~/flex_bison/2$ ./a.out
 
12-36*10/(1+2+3)#compute
 
=-48
 
^C
myhaspl@myhaspl:~/flex_bison/2$

前面都是以键盘输入 的方式进行计算器运算,我们下面以文件方式提供给该解释器进行计算,首先,将flex文件改为(将其中中文去除,然后对于非法字符的出现进行忽略):

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
%{
#include "calculator.tab.h"
%}
 
%%
"+"  {return ADD;}
"-"  {return SUB;}
""  {return MUL;}
"/"  {return DIV;}
"|"  {return ABS;}
"("  {return LEFTBRACKET;}
")"  {return RIGHTBRACKET;}
"#". /comment/
[0-9]+ {yylval=atoi(yytext);return NUMBER;}
\n {return EOL;}
[ \t] /blank/
. /invalid char/
%

接着,改bison文件,加入对文件的读写

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
%{
#include <stdio.h>
%}
 
%token NUMBER
%token ADD SUB MUL DIV ABS LEFTBRACKET RIGHTBRACKET
%token EOL
 
%%
 
calclist:/**/
 |calclist exp EOL{printf ("=%d\n",$2);}
 ;
 
exp:factor {$$ = $1;}
 |exp ADD factor{$$=$1+$3;}
 |exp SUB factor{$$=$1-$3;}
 ;
 
 
factor:term {$$=$1;}
 |factor MUL term{$$=$1*$3;}
 |factor DIV term{$$=$1/$3;}
 ;
term:NUMBER {$$=$1;}
 |ABS term {$$=$2>=0?$2:-$2;}
 |LEFTBRACKET exp RIGHTBRACKET {$$=$2;}
 ;
%%
main(int argc,char **argv){
int i;
if (argc<2){
  yyparse();
}
else{
  for(i=1;i<argc;i++)
    {
    FILE *f=fopen(argv[i],"r");
    if (!f){
     perror(argv[i]);
     return (1);
    }
   yyrestart(f);
   yyparse();
   fclose(f);
  }
}
}
 
yyerror(char *s)
{
 fprintf(stderr,"error:%s\n",s);
}

最后 测试一下

?
1
2
3
4
5
6
7
8
root@myhaspl:~/test/3# make
bison -d calculator.y
flex calculator.l
gcc calculator.tab.c lex.yy.c -lfl
root@myhaspl:~/test/3# ./a.out mycpt1.cpt mycpt2.cpt
=158
=-8
root@myhaspl:~/test/3#

其中两个CPT文件内容类似 为:

12*66/(10-5)

我们接着完善这个计算器程序,让算式能显示出来,修改calculator.l

通过加入printf语句,打印词法分析器解析到的字符。比如 :

..................

[0-9]+ {yylval=atoi(yytext);printf("%d",yylval);return NUMBER;}

\n  {return EOL;}

[ \t] /blank/

. /invalid char/

%%

然后编译执行。

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
root@myhaspl:~/test/4# make
 
bison -d calculator.y
 
flex calculator.l
 
gcc calculator.tab.c lex.yy.c -lfl
 
root@myhaspl:~/test/4# ./a.out
 
12+66
 
12+66=78
 
^C
 
root@myhaspl:~/test/4# ./a.out mycpt1.cpt mycpt2.cpt 
 
12*66/(10-5)=158
 
77/(10+1)-15=-8

接下来加上读取的行号,将结果的显示更加人性化

flex文件要改:

\n  {printf("<line:%4d>",yylineno);yylineno++;return EOL;}

然后,bison文件也改:

calclist:/**/
  |calclist exp EOL{printf ("the result is:%d\n",$2);}
  ;

最后 ,编译运行测试一下。

?
1
2
3
4
5
6
7
8
9
10
root@myhaspl:~/test/4# make
bison -d calculator.y
flex calculator.l
gcc calculator.tab.c lex.yy.c -lfl
root@myhaspl:~/test/4# ./a.out mycpt1.cpt mycpt2.cpt
1266/(10-5)<line:  1>the result is:158
12/22-8<line:  2>the result is:-8
77(6-2)<line:  3>the result is:308
77/(10+1)-15<line:  4>the result is:-8
root@myhaspl:~/test/4#