编译原理实验二——消除一切文法的左递归(c++实现)

这篇具有很好参考价值的文章主要介绍了编译原理实验二——消除一切文法的左递归(c++实现)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

编译原理实验二——消除文法的左递归(c++实现)

首先给出书中的算法截图:
消除文法的左递归,编译原理,c++
第一步:处理产生式的输入

所有产生式使用一个结构体存储:

struct node
{
	string left;
	set<string>right;
};

可以看到,left代表产生式的左部,right代表产生式的右部,而且是一个集合。
例如S->Qc|c,在程序中,left=S,right=Qc,c
输入的结果保存在一个vector的数据结构中,并起名为v
输入函数为:

void getproduction()
{
	printf("若一个非终结符可推出多个结果,请直接以 | 分隔,不必分开输入\n");
	printf("输入产生式,以$为结束标志:\n");
	string str;
	while (cin >> str && str[0] != '$')
	{
		vector<node>ret = mysplit(str);
		v.push_back(ret[0]);
	}

}

由于输入是一整行字符串,所以我们需要根据字符将产生式的左部和右部的结果剥离出来,在这里调用mysplit()函数。下面是mysplit()函数的具体代码。

vector<node> mysplit(string str)
{
	string vleft;
	set<string>vright;
	string temp = "";
	for (int i = 0; i < str.size(); i++)
	{
		if (str[i] == '>')continue;
		if (str[i] == '-')
		{
			vleft=temp;
			temp = "";
			continue;
		}
		if (str[i] == '|')
		{
			vright.insert(temp);
			temp = "";
			continue;
		}
		temp += str[i];
	}
	if (temp != "")vright.insert(temp);
	vector<node>ret;
	struct node N = {vleft,vright};
	ret.push_back(N);
	return ret;
}

代码原理很简单,直接遍历字符串,遇到-,>,| 等特殊字符就对应插入left或right中。

第二步:获取所有非终结符,并排序

void getnotend()
{
	set<string>tempset;
	for (int i = 0; i < v.size(); i++)
	{
		tempset.insert(v[i].left);

	}

	set<string>::iterator it = tempset.begin();
	for (it; it != tempset.end(); it++)
	{
		notend.push_back(*it);
	}
	
}

getnotend()函数获取了所有的非终结符。直接遍历v中保存的所有产生式的左部,存入set中。
(v是保存了所有产生式的变量名,为vector类型)
所有的非终结符被保存在notend中,其定义为vector类型

第三步:两层for循环,在这里封装成了myoperate()函数。

void myoperate()
{
	for (int i = 0; i < notend.size(); i++)//FOR i:=1 TO N DO
	{
		for (int j = 0; j < i; j++)//FOR j:=1 TO i-1 DO
		{
			int posi=-1, posj=-1;			
			for (int k = 0; k < v.size(); k++)
			{
				if (v[k].left == notend[i])/*遍历所有产生式,找到第i个非终结符在所有产生式中的位置*/
				{
					posi = k;
					break;
				}
			}
			for (int k = 0; k < v.size(); k++)/*遍历所有产生式,找到第i个非终结符在所有产生式中的位置*/
			{
				if (v[k].left == notend[j])
				{
					posj = k;
					break;
				}
			}
			if (posi == -1 || posj == -1)continue;/*如果找不到,就不执行下面的代码。例如:非终结符S在v中是第3个,非终结符R在v中是第1个,则posi=3,posj=1*/

			set<string>::iterator it = v[posi].right.begin();
			set<string>::iterator it2 ;
			set<string>tempset;
			for (it; it != v[posi].right.end(); it++)
			{
				string tempstr = *it;
				string ss;
				if (tempstr.find(notend[j]) != -1)
				{
					for (it2 = v[posj].right.begin(); it2 !=v[posj].right.end(); it2++)
					{
						ss = tempstr;
						ss = myreplace(ss, notend[j], *it2);
						tempset.insert(ss);
					}
					
				}
			}
			vector<string>temv;
			for (it = v[posi].right.begin(); it != v[posi].right.end(); it++)
			{
				string str = *it;
				if (str.find(notend[j]) != -1)
					temv.push_back(str);
			}
			for (int x = 0; x < temv.size(); x++)
			{
				it = v[posi].right.find(temv[x]);
				if (it != v[posi].right.end())
					v[posi].right.erase(it);
			}
			for (it = tempset.begin(); it != tempset.end(); it++)
				v[posi].right.insert(*it);
			erasedirect(posi);

		}
	}
}

在这里给出此函数的解释,代码中使用了许多临时变量记录信息。但整体思路如下:
以书本中给出的例子,有一个文法:
(1)S->Qc|c
(2) Q->Rb|b
(3) R->Sa|a

求它消除左递归的最终文法。

由于代码中下标从0开始,当i=2,j=0时,我们看第(1),第(3)个产生式。我们拿出第(3)个产生式的所有右部,得到 Sa和a。对每一个右部,若它有第j个非终结符,就可以把第j个终结符可以推出的所有结果拿来替换。
比如,我们拿出Sa,发现它有第j个非终结符S,所以S可以推出的所有结果都可以换到Sa身上,Sa就可以变成Qca和ca. 然后,我们拿出a,发现它没有S,直接跳过。最后,R->Qca|ca|a,也就是书中的答案。

代码中已对一些细节做了考虑,具体参考代码。

第四步:消除Ai中的一切直接左递归

首先,直接左递归见书中的定义:

消除文法的左递归,编译原理,c++
A->Aa1|Aa2|…|Aam|b1|b2|b3|b3

那么,我们就看产生式是不是满足这种形式

首先如何判断b1,b2,b3?
如果右部没有大写字母,就可以认为它是b1,b2,b3
因此,有了下面的函数:

bool allend(string str)
{
	for (int i = 0; i < str.size(); i++)
	{
		if (str[i] >= 'A' && str[i] <= 'Z')
			return false;
	}
	return true;
}

如何判断右部是与左部一样的字符串开头呢
首先给出c++字符串查找函数find(),rfind()。
find()可以从前往后找,找到第一个匹配的字符串,返回下标,如果找不到,返回-1
rfind()可以从后往前找,找到第一个匹配的字符串,返回下标,如果找不到,返回-1

那么,我们可以从前往后找,再从后往前找,如果遇到的第一个匹配字符都是下标为0,说明符合
A->Aa这种形式。比如 A->AabcA, find()的结果是0,rfing()的结果是4。

下面给出消除一切直接左递归的代码

void erasedirect(int posi)
{
	set<string>::iterator it = v[posi].right.begin();

	bool flag = true;
	for (it; it != v[posi].right.end(); it++)
	{
		string str = *it;
		if ((str.find(v[posi].left) == str.rfind(v[posi].left) && str.find(v[posi].left) == 0) || allend(str))
			flag = true;
		else
		{
			flag = false;
			break;
		}

	}
	if (!flag)return;

	vector<string>va, vb;
	for (it = v[posi].right.begin(); it != v[posi].right.end(); it++)
	{
		string str = *it;
		if (str.find(v[posi].left) == -1)
		{
			vb.push_back(str);
		}
		else
		{
			str.erase(0, v[posi].left.size());
			va.push_back(str);
		}
	}
	v[posi].right.clear();
	for (int i = 0; i < vb.size(); i++)
	{
		v[posi].right.insert(vb[i] + v[posi].left+"'");
	}

	set<string>ans;
	for (int i = 0; i < va.size(); i++)
	{
		ans.insert(va[i] + v[posi].left + "'");
	}
	ans.insert("Σ");
	struct node N = { v[posi].left + "'",ans };
	v.push_back(N);
}

首先我们确定Ai的产生式是不是满足A->Aa|b这种形式,如果不是,flag=false,直接结束运行,否则,继续往下做。

当我们确定Ai推出的式子都是Aa或b后,我们可以遍历Ai的所有右部,把Aa的抠出来,存在va中,b抠出来,存在vb中,然后字符串拼接答案,给非终结符加上一撇,就可以了。

最后给出完整的可运行代码:

#include<iostream>
#include<cmath>
#include<algorithm>
#include<map>
#include<vector>
#include<unordered_map> 
#include<set>
using namespace std;


struct node
{
	string left;
	set<string>right;
};
vector<node>v;
vector<string>notend;


bool allend(string str)
{
	for (int i = 0; i < str.size(); i++)
	{
		if (str[i] >= 'A' && str[i] <= 'Z')
			return false;
	}
	return true;
}


void getnotend()
{
	set<string>tempset;
	for (int i = 0; i < v.size(); i++)
	{
		tempset.insert(v[i].left);

	}

	set<string>::iterator it = tempset.begin();
	for (it; it != tempset.end(); it++)
	{
		notend.push_back(*it);
	}
	
}



vector<node> mysplit(string str)
{
	string vleft;
	set<string>vright;
	string temp = "";
	for (int i = 0; i < str.size(); i++)
	{
		if (str[i] == '>')continue;
		if (str[i] == '-')
		{
			vleft=temp;
			temp = "";
			continue;
		}
		if (str[i] == '|')
		{
			vright.insert(temp);
			temp = "";
			continue;
		}
		temp += str[i];
	}
	if (temp != "")vright.insert(temp);
	vector<node>ret;
	struct node N = {vleft,vright};
	ret.push_back(N);
	return ret;
}



void getproduction()
{
	printf("若一个非终结符可推出多个结果,请直接以 | 分隔,不必分开输入\n");
	printf("输入产生式,以$为结束标志:\n");
	string str;
	while (cin >> str && str[0] != '$')
	{
		vector<node>ret = mysplit(str);
		v.push_back(ret[0]);
	}

}

string myreplace(string str, string s,string t)
{
	while (str.find(s) != -1)
	{
		int pos = str.find(s);
		str.replace(pos, s.size(), t);
	}
	return str;
}

void erasedirect(int posi)
{
	set<string>::iterator it = v[posi].right.begin();

	bool flag = true;
	for (it; it != v[posi].right.end(); it++)
	{
		string str = *it;
		if ((str.find(v[posi].left) == str.rfind(v[posi].left) && str.find(v[posi].left) == 0) || allend(str))
			flag = true;
		else
		{
			flag = false;
			break;
		}

	}
	if (!flag)return;

	vector<string>va, vb;
	for (it = v[posi].right.begin(); it != v[posi].right.end(); it++)
	{
		string str = *it;
		if (str.find(v[posi].left) == -1)
		{
			vb.push_back(str);
		}
		else
		{
			str.erase(0, v[posi].left.size());
			va.push_back(str);
		}
	}
	v[posi].right.clear();
	for (int i = 0; i < vb.size(); i++)
	{
		v[posi].right.insert(vb[i] + v[posi].left+"'");
	}

	set<string>ans;
	for (int i = 0; i < va.size(); i++)
	{
		ans.insert(va[i] + v[posi].left + "'");
	}
	ans.insert("Σ");
	struct node N = { v[posi].left + "'",ans };
	v.push_back(N);
}

void myoperate()
{
	for (int i = 0; i < notend.size(); i++)//FOR i:=1 TO N DO
	{
		for (int j = 0; j < i; j++)//FOR j:=1 TO i-1 DO
		{
			int posi=-1, posj=-1;			
			for (int k = 0; k < v.size(); k++)
			{
				if (v[k].left == notend[i])/*遍历所有产生式,找到第i个非终结符在所有产生式中的位置*/
				{
					posi = k;
					break;
				}
			}
			for (int k = 0; k < v.size(); k++)/*遍历所有产生式,找到第i个非终结符在所有产生式中的位置*/
			{
				if (v[k].left == notend[j])
				{
					posj = k;
					break;
				}
			}
			if (posi == -1 || posj == -1)continue;/*如果找不到,就不执行下面的代码。例如:非终结符S在v中是第3个,非终结符R在v中是第1个,则posi=3,posj=1*/

			set<string>::iterator it = v[posi].right.begin();
			set<string>::iterator it2 ;
			set<string>tempset;
			for (it; it != v[posi].right.end(); it++)
			{
				string tempstr = *it;
				string ss;
				if (tempstr.find(notend[j]) != -1)
				{
					for (it2 = v[posj].right.begin(); it2 !=v[posj].right.end(); it2++)
					{
						ss = tempstr;
						ss = myreplace(ss, notend[j], *it2);
						tempset.insert(ss);
					}
					
				}
			}
			vector<string>temv;
			for (it = v[posi].right.begin(); it != v[posi].right.end(); it++)
			{
				string str = *it;
				if (str.find(notend[j]) != -1)
					temv.push_back(str);
			}
			for (int x = 0; x < temv.size(); x++)
			{
				it = v[posi].right.find(temv[x]);
				if (it != v[posi].right.end())
					v[posi].right.erase(it);
			}
			for (it = tempset.begin(); it != tempset.end(); it++)
				v[posi].right.insert(*it);
			erasedirect(posi);

		}
	}
}










int main()
{

	getproduction();

	getnotend();
	/*notend.push_back("S");
	notend.push_back("Q");
	notend.push_back("R");*/

	myoperate();
	printf("消除一切左递归后的结果为:\n");

	for (int i = 0; i < v.size(); i++)
	{
		cout << v[i].left << "->";
		set<string>::iterator it = v[i].right.begin();
		int cnt = 0;
		for (it; it != v[i].right.end(); it++)
		{
			cout << *it;
			cnt++;
			if (cnt != v[i].right.size())
				cout << '|';
		}
		cout << endl;
	}

	return 0;
}

测试用例是书中原题:
(1)S->Qc|c
(2) Q->Rb|b
(3) R->Sa|a
求它消除左递归的最终文法。

给出输入:

S->Qc|c
Q->Rb|b
R->Sa|a
$

运行结果:
消除文法的左递归,编译原理,c++

这个答案和书中给出的不一样,这是因为notend(非终结符)中的排序结果是按字典序从小到大排的,结果是Q,R,S。
下面我们强制给notend输入顺序为S,Q,R,只需注释掉获取非终结符的函数getnotend(),手动给出顺序为S,Q,R即可。
消除文法的左递归,编译原理,c++
结果和书中给出的一样!
消除文法的左递归,编译原理,c++

书中也给出了R,Q,S的顺序,我们同样进行验证

消除文法的左递归,编译原理,c++
答案仍然一样!文章来源地址https://www.toymoban.com/news/detail-744046.html

到了这里,关于编译原理实验二——消除一切文法的左递归(c++实现)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 【编译原理】-- 递归下降语法分析设计原理与实现(C语言实现)

    本实验基于词法分析程序实现,可参考本人前面的文章。 目录 一、目标任务 二、程序功能描述 三、主要数据结构描述 四、程序结构描述 设计方法 First集和Follow集 递归子程序框图 函数定义及函数之间的调用关系 五、程序测试 测试用例1 测试结果1 测试用例2 测试结果2 测试

    2023年04月21日
    浏览(48)
  • 特征筛选之特征递归消除法及Python实现

            特征递归消除法(Feature Recursive Elimination,简称RFE)是一种特征选择的算法,它通过反复训练模型,并剔除其中的弱特征,直到达到所需的特征数量。 该算法的步骤如下: 首先,将所有的特征都输入模型,得到模型的性能评价指标(比如准确率、F1得分等)。 然

    2024年02月13日
    浏览(38)
  • 【编译原理实验】 -- 词法分析程序设计原理与实现(C语言实现)

    目录 目标任务 设计要求 一、程序功能描述 二、正则文法 三、程序结构描述 四、代码  五、程序测试  测试用例1 测试结果1 测试用例2 测试结果2 以下为正则文法所描述的 C 语言子集单词符号的示例,请补充单词符号:++,--, , , += , -= ,*=, /= ,(逻辑与),||(逻辑或),

    2024年02月02日
    浏览(106)
  • 编译原理实验三:算符优先分析算法的设计与实现

    实验三 算符优先分析算法的设计与实现 一、 实验目的 根据算符优先分析法,对表达式进行语法分析,使其能够判断一个表达式是否正确。通过算符优先分析方法的实现,加深对自下而上语法分析方法的理解。 二、 实验要求 1、输入文法。可以是如下算术表达式的文法(你

    2024年02月06日
    浏览(51)
  • 随机森林的REF递归特征消除法来筛选特征(python实现不依赖sklearn)

    随机森林的REF递归特征消除法是一种基于模型的特征选择方法。它通过构建随机森林模型,并反复训练模型来评估每个特征的重要性,从而递归地消除不重要的特征。REF方法通过以下步骤实现: 1.计算初始模型在所有特征上的特征重要性得分。 2.去掉得分最低的特征,并重新

    2024年02月04日
    浏览(42)
  • 【编译原理】 实验一:词法分析器的自动实现(Lex词法分析)

    相关代码实操移步视频 https://www.bilibili.com/video/BV13x4y1o7FL 1.借助词法分析工具Flex或Lex完成(参考网络资源) 2.输入:高级语言源代码(如helloworld.c) 3.输出:以二元组表示的单词符号序列。 通过设计、编制、调试一个具体的词法分析程序,加深对词法分析原理的理解,并掌握

    2024年02月08日
    浏览(52)
  • 编译原理笔记11:自上而下语法分析(1)基础概念、左递归和公共左因子处理、递归下降分析(咕咕咕)

    词法分析,是把源程序分析成记号流,识别其中的单词。 语法分析,是要分析词法分析产生的记号流中的语法结构是否正确——对词法分析得到的记号流进行分析,以确认其是不是一个可以由我们定义好的文法推出来的句子。如果语法结构正确,语法分析器最终要为输入序列

    2024年02月11日
    浏览(42)
  • 回归预测 | MATLAB实现基于SVM-RFE-BP支持向量机递归特征消除特征选择算法结合BP神经网络的多输入单输出回归预测

    预测效果 基本介绍 MATLAB实现基于SVM-RFE-BP支持向量机递归特征消除特征选择算法结合BP神经网络的多输入单输出回归预测,输出为选择的特征序号 Chinese: Options:可用的选项即表示的涵义如下 -s svm类型:SVM设置类型(默认0) 0 – C-SVC 1 --v-SVC 2 – 一类SVM 3 – e -SVR 4 – v-SVR -t 核函

    2024年02月14日
    浏览(51)
  • 编译原理:算符优先分析实验

    什么是算符优先分析法 算符优先分析法是一种简单、直观的自下而上分析法 算符优先分析法就是仿照算术表达式的四则运算过程而设计的一种语法分析方法。 这种分析方法首先要规定运算符之间(确切地说终结符之间)的优先关系和结合性质,然后借助这种关系,比较相邻

    2024年02月06日
    浏览(37)
  • Java小技巧:利用蹦床和CPS消除递归中栈溢出

    在编写递归程序时候,出现栈溢出并不是什么稀奇的事,这种时候,我们有时候可以利用尾递归优化,有时候可以改为循环写法,甚至还可以调整java虚拟机参数来改变栈大小。但是并非所有的递归都可以改写为其他形式,有些程序的递归写法甚至是最优最简写法,改成其他形

    2024年02月05日
    浏览(28)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包