从零到有的lex学习

最近总是在忙各种事情，毕业设计要求写一个基于云计算的java语法分析器。其实选题的时候就没有底，现在什么都不懂，只有从零开始。
我与lex和yacc的缘分应该是在编译原理课程上，但是当时有很多门课，所以就没有管他。到了实验室老师叫我用lex和yacc写一个计算器后台运行程序。我当时就蒙啦！由于要学html和php所以就一直拖着，到了现在终于轮到学习他啦。好了，不多说啦。开始吧！
lex部分
lex分为三部分：第一部分是声明部分，什么c中的宏定义呀，变量什么的，随便写。这类的书也很多。
第二部分就是规则区，这里面就是lex的核心的部分啦。参看“原始的lex模式匹配”和“模式匹配示例”，这两个是核心东西，要好好看哈。
第三部分还是c语言的东西，main函数也在这里。但是要注意，因为这里会用到lex里面很多函数（其实这些函数都是在lex里面有的，你只需要记住他们当功能就可以啦！）
下面附上我刚在书上抄下来的代码（我本来想借图书馆里的《lex与yacc》这本书的，但是都被借走了，亚马逊上看了一下三十多块呢，想想还是算了。我就借了《编译器设计》Santanu Chattopadhyay 著徐骁栋王海涛译的，这本书真心精炼，对于只是用用lex和yacc的同学来说相当实在，初学者也很好。）

%{
int yylineno;
%}
%%
^(.*)\n printf("%4d\t%s",++yylineno,yytext);
%%
int main(int argc,char **argv)
{
yyin=fopen(argv[1],"r");
yylex();
fclose(yyin);
}
这段代码很简单，但是什么东西都有。作用就是输出你输入文件当中的每一行，但是在每一行前面加上行号。yylineno是我定义用来记录行号的。yytext的定义是这样的：char*yytext，用来指向匹配字符串的指针。当然这类的东西还有很多，什么yyleng，yyout的，你自己去看吧！yyin的定义是FILE*yyin输入文件。yylex（）笔者认为就是调用词法分析器的函数。都在强大的lex背后。好了。那么下面来用用它吧。
nano lex.l 然后就把上面的代码复制进去 ctrl+o，enter，ctrl+x。就这么愉快的搞定啦。写一个测试的test.txt。同样nano test.txt.然后随便写点东西，保存，退出。ctrl+o，enter，ctrl+x。
先用lex弄出我们的分析器来：lex lex.l
你会发现你的文件夹里面多了一个lex.yy.c没错，这就是lex生成的c代码。接下来我是在ubuntu下面编译的。
gcc -o lexy lex.yy.c -ll 后面加-ll我也不知到是什么意思，反正就要这么弄不然就会出错
/tmp/ccx4W13y.o: In function `yylex':
lex.yy.c:(.text+0x4b2): undefined reference to `yywrap'
/tmp/ccx4W13y.o: In function `input':
lex.yy.c:(.text+0x100b): undefined reference to `yywrap'
collect2: ld 返回 1
所以我们还是加上吧！
最后运行 ./lexy test.txt你就会看到愉快的输出啦。
千万别直接来lexy test.txt系统会提示你没有lexy这个命令。之前笔者就直接弄的lex，然后输入 lex test.txt 结果就是说我输入有问题。
申明哈，笔者linux刚开始，所以命令不是很熟悉，这是第一篇博客，就先写lex了，等我后续完成yacc之后再来。等我写完计算器就分享给大家源代码。

秒客网

从零到有的lex学习

相关文章