【编译原理实验】 -- 词法分析程序设计原理与实现(C语言实现)

这篇具有很好参考价值的文章主要介绍了【编译原理实验】 -- 词法分析程序设计原理与实现(C语言实现)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

目录

目标任务

设计要求

一、程序功能描述

二、正则文法

三、程序结构描述

四、代码

 五、程序测试

 测试用例1

测试结果1

测试用例2

测试结果2


目标任务

以下为正则文法所描述的 C 语言子集单词符号的示例,请补充单词符号:++,--, >>, <<, += , -= ,*=, /= ,&&(逻辑与),||(逻辑或),!(逻辑非)等等,给出补充后描述 C 语言子集单词符号的正则文法,设计并实现其词法分析程序。

<标识符>→字母︱ <标识符>字母︱ <标识符>数字

<无符号整数>→数字︱ <无符号整数>数字

<单字符分界符> →+ ︱- ︱* ︱;︱, ︱(︱) ︱{︱} <双字符分界符>→<大于>=︱<小于>=︱<小于>>︱<感叹号>=︱<等于>=︱<斜竖>*

<小于>→<

<等于>→=

<大于>→>

<斜竖> →/

 <感叹号>→!

该语言的保留字 :void、int、float、double、if、else、for、do、while 等等(也可补充)。

设计要求

1)可将该语言设计成大小写不敏感,也可设计成大小写敏感,用户定义的标识符最长不超过 32 个字符;

(2)字母为 a-z A-Z,数字为 0-9;

(3)可以对上述文法进行扩充和改造;

(4)“/*……*/”和“//”(一行内)为程序的注释部分。

(5)给出各单词符号的类别编码;

(6)词法分析程序应能发现输入串中的错误;

(7)词法分析作为单独一遍编写,词法分析结果为二元式序列组成的中间文件;

(8)设计两个测试用例(尽可能完备),并给出测试结果。
 


一、程序功能描述

输入源程序,词法分析后,能发现其中的错误;

能够识别注释的开始结束、单字符分界符、双字符分界符;

分析结果为二元式序列组成的中间文件。

二、正则文法

G[<单词符号>]:

<单词符号>→<标识符>|<无符号整数>|<单字符分界符>|<双字符分界符>

<标识符>→字母|<标识符>字母|<标识符>数字

<无符号整数>→数字|<无符号整数>数字

<单字符分界符>→% | ; | , | ( | ) | { | } | [ | ]

<双字符分界符>→<大于>=|<小于>=|<感叹号>=|<等于>=|<斜号>*|<加号>+|<加号>=|<减号>-|<减号>=|<星号>=|<斜竖>=|<大于>>|<小于><|<与符号>&|<或符号>| |<斜号>/|<星号>/

<小于>→<              <等于>→=            <大于>→>              <感叹号>→!

<斜号>→/                <加号>→+             <减号>→-               <星号>→*

<与符号>→&           <或符号>→|

三、程序结构描述

设计方法

单词符号类别编码

单词符号

类别编码

单词符号

类别编码

标识符

1

%

20

无符号整数

2

;

21

void

3

,

22

int

4

(

23

float

5

)

24

double

6

{

25

If

7

}

26

else

8

[

27

for

9

]

28

do

10

>

29

while

11

<

30

return

12

=

31

break

13

!

32

continue

14

>=

33

char

15

<=

34

+

16

!=

35

-

17

==

36

*

18

++

37

/

19

--

38

+=

39

<<

44

-=

40

&&

45

*=

41

||

46

/=

42

&

47

>>

43

|

48

状态转换图

【编译原理实验】 -- 词法分析程序设计原理与实现(C语言实现)

【编译原理实验】 -- 词法分析程序设计原理与实现(C语言实现)

函数定义及函数之间的调用关系

isLetter:判断是否是字母a-z,A-Z

isDigit:判断是否是数字0-9

getIdentifier_ID:返回保留字或标识符编号

getSinglechar_ID:返回单字符分界符编号

四、代码

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
int isLetter(char c){ 
	if((c>='a'&&c<='z')||(c>='A'&&c<='Z')) return 1;
	return 0;
}
int isDigit(char c){
	if(c>='0'&&c<='9') return 1;
	return 0;
}
int getIdentifier_ID(char s[]){
	if(strcmp(s,"void")==0) return 3;
	else if(strcmp(s,"int")==0) return 4;
	else if(strcmp(s,"float")==0) return 5;
	else if(strcmp(s,"double")==0) return 6;
	else if(strcmp(s,"if")==0) return 7;
	else if(strcmp(s,"else")==0) return 8;
	else if(strcmp(s,"for")==0) return 9;
	else if(strcmp(s,"do")==0) return 10;
	else if(strcmp(s,"while")==0) return 11;
	else if(strcmp(s,"return")==0) return 12;
	else if(strcmp(s,"break")==0) return 13;
	else if(strcmp(s,"continue")==0) return 14;
	else if(strcmp(s,"char")==0) return 15;
	else return 1;//是标识符 
}
int getSinglechar_ID(char c){
	if(c==';') return 21;
	else if(c=='%') return 20;
	else if(c==',') return 22;
	else if(c=='(') return 23;
	else if(c==')') return 24;
	else if(c=='{') return 25;
	else if(c=='}') return 26;
	else if(c=='[') return 27;
	else if(c==']') return 28;
	else return 0;//非单字符 
}
int main(){
	FILE *fp=NULL;//输入文件 
	fp=fopen("demo_in.txt","r");
	FILE *fw=NULL;//输出文件 
	fw=fopen("demo_out.txt","w");
	char ch;//接收字符 
	char s1[32];//标识符 
	char s2[32];//无符号整数 
	int i=0;
	int id;
	int flag=0;
	ch=fgetc(fp);
	while(!feof(fp)){
		if(ch==' '||ch=='\t'){//为空格或制表符则不处理,获取下一个字符 
			ch=fgetc(fp);
			continue;
		}else if(ch=='\n'){
			fprintf(fw,"\n");
			ch=fgetc(fp);
			continue;
		}else if(isLetter(ch)==1){//标识符 
			i=0;
			s1[i++]=ch;
			while(isLetter(ch)==1||isDigit(ch)==1){
				ch=fgetc(fp);
				s1[i++]=ch;
			}
			s1[i-1]='\0';
			id=getIdentifier_ID(s1);
			fprintf(fw,"(%d,%s)",id,s1);
		}else if(isDigit(ch)==1){//无符号整数 
			i=0;
			s2[i++]=ch;
			while(isDigit(ch)==1){
				ch=fgetc(fp);
				s2[i++]=ch;
			}
			s2[i-1]='\0';
			fprintf(fw,"(2,%s)",s2);
		}else if(getSinglechar_ID(ch)!=0){//单字符分界符 
			fprintf(fw,"(%d,%c)",getSinglechar_ID(ch),ch);
			ch=fgetc(fp);
		}else if(ch=='>'){//大于 
			ch=fgetc(fp);
			if(ch=='='){
				fprintf(fw,"(33,>=)");
				ch=fgetc(fp);
			}else if(ch=='>'){
				fprintf(fw,"(43,>>)");
				ch=fgetc(fp);
			}else{
				fprintf(fw,"(29,>)");
			}
		}else if(ch=='<'){//小于 
			ch=fgetc(fp);
			if(ch=='='){
				fprintf(fw,"(34,<=)");
				ch=fgetc(fp);
			}else if(ch=='<'){
				fprintf(fw,"(44,<<)");
				ch=fgetc(fp);
			}else{
				fprintf(fw,"(30,<)");
			}
		}else if(ch=='!'){//感叹号 
			ch=fgetc(fp);
			if(ch=='='){
				fprintf(fw,"(35,!=)");
				ch=fgetc(fp);
			}else{
				fprintf(fw,"(32,!)");
			}
		}else if(ch=='='){//等于 
			ch=fgetc(fp);
			if(ch=='='){
				fprintf(fw,"(36,==)");
				ch=fgetc(fp);
			}else{
				fprintf(fw,"(31,=)");
			}
		}else if(ch=='/'){//斜号 
			ch=fgetc(fp);
			if(ch=='*'){
				fprintf(fw,"(处理注释,/*)");
				while(1){
					flag=0;
					ch=fgetc(fp);
					while(ch=='*'){//不用if,while可以处理/*后多个*的问题 
						ch=fgetc(fp);
						if(ch=='/'){
							fprintf(fw,"(注释结束,*/)");
							ch=fgetc(fp);
							flag=1;
						}
					}
					if(flag==1) break;
				}
			}else if(ch=='/'){
				fprintf(fw,"(处理注释,//)");
				while(ch!='\n'){
					ch=fgetc(fp);
				}
				fprintf(fw,"\n");
				ch=fgetc(fp);
			}else if(ch=='='){
				fprintf(fw,"(42,/=)");
				ch=fgetc(fp);
			}else{
				fprintf(fw,"(19,/)");
			}
		}else if(ch=='&'){//与符号 
			ch=fgetc(fp);
			if(ch=='&'){
				fprintf(fw,"(45,&&)");
				ch=fgetc(fp);
			}else{
				fprintf(fw,"(47,&)");
			}
		}else if(ch=='|'){//或符号 
			ch=fgetc(fp);
			if(ch=='|'){
				fprintf(fw,"(46,||)");
				ch=fgetc(fp);
			}else{
				fprintf(fw,"(48,|)");
			}
		}else if(ch=='+'){//加号 
			ch=fgetc(fp);
			if(ch=='='){
				fprintf(fw,"(39,+=)");
				ch=fgetc(fp);
			}else if(ch=='+'){
				fprintf(fw,"(37,++)");
				ch=fgetc(fp);
			}else{
				fprintf(fw,"16,+");
			}
		}else if(ch=='-'){//减号 
			ch=fgetc(fp);
			if(ch=='='){
				fprintf(fw,"(40,-=)");
				ch=fgetc(fp);
			}else if(ch=='-'){
				fprintf(fw,"(38,--)");
				ch=fgetc(fp);
			}else{
				fprintf(fw,"(17,-)");
			}
		}else if(ch=='*'){//星号 
			ch=fgetc(fp);
			if(ch=='='){
				fprintf(fw,"(41,*=)");
				ch=fgetc(fp);
			}else{
				fprintf(fw,"(18,*)");
			}
		}else{//其他,出错 
			fprintf(fw,"\n错误:未定义->%c",ch);
			printf("错误:未定义->%c\n",ch);
			break;
		}
	}
	fclose(fp);
	fclose(fw);
	printf("二元式序列组成的中间文件已经生成!\n");
	return 0;
}

 五、程序测试

 测试用例1

【编译原理实验】 -- 词法分析程序设计原理与实现(C语言实现)

 

测试结果1

【编译原理实验】 -- 词法分析程序设计原理与实现(C语言实现)

 

测试用例2

【编译原理实验】 -- 词法分析程序设计原理与实现(C语言实现)

 

测试结果2

【编译原理实验】 -- 词法分析程序设计原理与实现(C语言实现)


 如果对你有帮助的话,可以考虑点个赞~~文章来源地址https://www.toymoban.com/news/detail-431056.html

到了这里,关于【编译原理实验】 -- 词法分析程序设计原理与实现(C语言实现)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • HNU-编译原理-实验1-利用FLEX构造C-Minus-f词法分析器

    计科210X 甘晴void 202108010XXX 详细的实验项目文档为 https://gitee.com/coderwym/cminus_compiler-2023-fall/tree/master/Documentations/lab1 学习和掌握词法分析程序的逻辑原理与构造方法。通过 FLEX 进行实践, 构造 C-Minus-f 词法分析器。具体完成过程如下: 学习 C-Minus-f 的词法规则 学习 FLEX 工具使

    2024年01月20日
    浏览(51)
  • 编译原理———词法分析器

    设计并实现一个包含预处理功能的词法分析程序,加深对编译中词法分析过程的理解。 输入:所给文法的源程序字符串。 输出:二元组(syn,token或sum)构成的序列。其中,  syn为单词种别码。  Token为存放的单词自身字符串。  Sum为整型常量。 具体实现时,可以将单词的二

    2024年02月08日
    浏览(56)
  • 编译原理词法分析器(C/C++)

            词法分析器不用多说,一开始我还不知道是什么样的,看了下别人的博客,再看看书,原来是输出二元组,这不就是字符串操作嘛。然后细看几篇博客,发现大都是用暴力判断来写的。我对代码重复性比较高的方法不太感冒,不是说我编程有多好,就是单纯的不喜欢

    2024年02月06日
    浏览(54)
  • 编译原理1.6习题 程序设计语言基础

    图源:文心一言 编译原理习题整理~🥝🥝 作为初学者的我,这些习题主要用于自我巩固。由于是自学,答案难免有误,非常欢迎各位小伙伴指正与讨论!👏💡 第1版:自己的解题,与AI老师的判卷~🧩🧩 编辑: 梅头脑🌸  审核: 文心一言 题源: 龙书《编译原理》 Alfre

    2024年01月19日
    浏览(56)
  • 算法设计与分析实验:分治与减治算法实验:题目1 数字旋转方阵程序设计

    目录 前言 一、数字旋转方阵 二、实验内容 三、实验目的 四、实验步骤 五、实验过程  总结 算法同样是计算机四大件的一个很重要的内容,本实验的目的是通过编写一个数字旋转方阵程序,来掌握分治与减治算法的基本思想和实现方法。 数字旋转方阵是一个n×n的矩阵,其

    2024年02月01日
    浏览(99)
  • 网络程序设计实验:TCP/IP协议栈源代码分析

    深入理解TCP/IP协议栈的源代码结构和功能,探究其与上层套接口和下层数据链路层的关联方式。 分析TCP的三次握手过程,理解其状态转换和数据传输机制。 掌握send和recv操作在TCP/IP协议栈中的执行路径,探究其与上层应用程序的交互方式。 了解路由表、ARP缓存以及IP到MAC地址

    2024年02月03日
    浏览(58)
  • 网络程序设计实验-TCP/IP协议栈源代码分析

    ​ inet_init代码如下: 调用inet_init的过程中,涉及到的函数如下: 1. start_kernel: start_kernel 是Linux内核的启动函数,定义在 init/main.c 文件中。 在启动过程中,首先执行 start_kernel ,这个函数负责进行内核的初始化工作。 2. rest_init: 在 start_kernel 中,会调用 rest_init 函数,该函数的

    2024年02月03日
    浏览(63)
  • 网络程序设计专题实验:TCP/IP协议栈源代码分析

    inet_init是如何被调用的?从start_kernel到inet_init调用路径 跟踪分析TCP/IP协议栈如何将自己与上层套接口与下层数据链路层关联起来的? TCP的三次握手源代码跟踪分析,跟踪找出设置和发送SYN/ACK的位置,以及状态转换的位置 send在TCP/IP协议栈中的执行路径 recv在TCP/IP协议栈中的执

    2024年02月02日
    浏览(63)
  • 编译原理实验三:预测分析法语法分析器的设计

    ​ 根据文法编制预测分析法语法分析程序,以便对输入的符号串进行语法分析。通过编写预测分析法语法分析程序掌握预测分析法的基本原理、FIRST和FOLLOW集的计算、预测分析表的构造方法以及语法分析法主控程序的设计。 对于给定的上下文无关文法,编程完成以下功能:

    2024年02月05日
    浏览(52)
  • 编译原理实验三:算符优先分析算法的设计与实现

    实验三 算符优先分析算法的设计与实现 一、 实验目的 根据算符优先分析法,对表达式进行语法分析,使其能够判断一个表达式是否正确。通过算符优先分析方法的实现,加深对自下而上语法分析方法的理解。 二、 实验要求 1、输入文法。可以是如下算术表达式的文法(你

    2024年02月06日
    浏览(50)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包