SLR1 分析:文法 E->E+T|T,T->T*F|F,F->(E)|d 的分析表构建错误分析与修正
SLR1 分析:文法 E->E+T|T,T->T*F|F,F->(E)|d 的分析表构建错误分析与修正
错误分析
在 SLR 分析表的构建中,对于归约项目的 follow 集合的处理存在问题。在代码中,对于一个含有归约项目的项目集合,只考虑了该项目集合中第一个项目的左部符号的 follow 集合,并将其作为该项目集合中所有归约项目的 follow 集合。但实际上,不同的归约项目可能会有不同的 follow 集合,因此需要对每个归约项目单独考虑其 follow 集合。
改正后的代码
public class SLRNode
{
public string Left;
public string Right;
public SLRNode(string Left, string Right)
{
this.Left = Left;
this.Right = Right;
}
}
//项目集类
public class SLRitemsets
{
public List<int> Container
= new List<int>(100);
//记录项目在项目集合中的序号
}
//DFA结点
public struct DFA
{
public int from;
public char symbol;
public int to;
public DFA(int from, char symbol, int to)
{
this.from = from;
this.symbol = symbol;
this.to = to;
}
}
//分析表 结点
public class Table
{
public bool error;//是否为ERROR
public char type;//结点类型
public int id;//数值
public Table()
{
this.error = true;
}
public Table(char type, int id)
{
this.type = type;
this.id = id;
this.error = false;
}
}
//分析句子
public class Analyze
{
public List<string> stack_state = new List<string>(100);//记录状态栈
public List<string> stack_symbol = new List<string>(100);//记录符号栈
public List<string> Input_str = new List<string>(100);//记录输入串
public List<string> Tran_pro = new List<string>(100);//记录所用产生式
}
public DFA[] dfa = new DFA[100];
public int Pindex = 0; //dfa数组指针
public Table[][] SLRAna;//分析表
public Analyze Jz;
public bool Success = false;
public List<SLRNode> SLRproNum = new List<SLRNode>(50);//产生式 列表
public List<SLRNode> SLRobjNum = new List<SLRNode>(50);//项目 列表
public List<SLRitemsets> proitemset = new List<SLRitemsets>(100);//项目集合
public List<int> Gy_obj = new List<int>(50);//归约项目序号集合
public List<int> Gy_itemset = new List<int>(50);//含有归约项目的集合的序号 的集合
public List<char> Nchar = new List<char>(50);//非终结符集合
public List<char> Echar = new List<char>(50);//终结符集合
public List<char>[] Follow; //每个非终结符的follow集合
public string RStr = '';
public string RStr_obitemset = '';//输出返回
public string RStr_DFA = '';
public string RStr_ANA = '';
public Table[][] GET_ANA()
{
SLRAnaly();
RStr_ANA += '
SLR0分析表:
';
int i;
for (i = 0; i < Echar.Count; i++)
{
RStr_ANA += Echar[i].ToString() + ' ';
}
for (i = 0; i < Nchar.Count; i++)
{
RStr_ANA += Nchar[i].ToString() + ' ';
}
RStr_ANA += '
';
for (i = 0; i < proitemset.Count; i++)
{
RStr_ANA += i.ToString() + ' ';
for (int j = 0; j < Echar.Count + Nchar.Count; j++)
{
if (SLRAna[i][j].error)
{
RStr_ANA += ' ' + ' ';
}
else if (i == 1 && j == Echar.Count - 1)
{
RStr_ANA += 'AC' + ' ';
}
else if (SLRAna[i][j].type != 'N')
{
RStr_ANA += SLRAna[i][j].type.ToString() + SLRAna[i][j].id.ToString() + ' ';
}
else
RStr_ANA += SLRAna[i][j].id.ToString() + ' ';
}
RStr_ANA += '
';
}
return SLRAna;
}
//分析表
public void SLRAnaly()
{
Table tnode = new Table();
SLRAna = new Table[proitemset.Count][];
for (int i = 0; i < proitemset.Count; i++)
SLRAna[i] = new Table[Echar.Count + Nchar.Count];
for (int i = 0; i < proitemset.Count; i++)//初始化 赋予ERROR属性
for (int j = 0; j < Echar.Count + Nchar.Count; j++)//为终结符加r状态
SLRAna[i][j] = tnode;
tnode = new Table('A', 0);
SLRAna[1][FindID(Echar, '#')] = tnode;//项目集1必定是接受项目 构建[1][#]:acc的情况 先直接赋值好 dfa里没有
for (int i = 0; i < Gy_itemset.Count; i++)
{
SLRitemsets itemset = proitemset[Gy_itemset[i]];
foreach (int item in itemset.Container)
{
SLRNode node = SLRobjNum[item];
if (node.Right == 'd') // 排除初始项目
continue;
List<char> follow = GetFollow(node);
foreach (char c in follow)
{
int CID = FindID(Echar, c);
SLRAna[Gy_itemset[i]][CID] = new Table('r', Find_pro(node));
if (c == '#')
{
foreach (char e in Echar)
{
int EID = FindID(Echar, e);
SLRAna[Gy_itemset[i]][EID] = new Table('r', Find_pro(node));
}
}
}
}
}
for (int i = 0; i < Pindex; i++)
{
if (isFinalsymbol(dfa[i].symbol))//symbol为非终结符 添加状态N
{
int CID = FindID(Nchar, dfa[i].symbol);
SLRAna[dfa[i].from][CID + Echar.Count] = new Table('N', dfa[i].to);
}
else //不是归约项目 添加状态S
{
int CID = FindID(Echar, dfa[i].symbol);
SLRAna[dfa[i].from][CID] = new Table('S', dfa[i].to);
}
}
}
public List<char> GetFollow(SLRNode node)
{
List<char> follow = new List<char>();
if (node.Left == 'E' && node.Right == 'T') // 特殊处理E->T,因为T可以接着乘法
{
follow.Add('*');
follow.AddRange(GetFollow(new SLRNode('T', node.Right)));
}
else if (node.Right != '' && isFinalsymbol(node.Right.Last())) // 右部最后一个符号是终结符
{
follow.Add(node.Right.Last());
}
else // 右部最后一个符号是非终结符
{
char next = node.Right.Last();
List<char> first = GetFirst(next);
if (first.Contains('#'))
{
first.Remove('#');
follow.AddRange(first);
follow.AddRange(GetFollow(new SLRNode(node.Left, node.Right.Substring(0, node.Right.Length - 1))));
}
else
{
follow.AddRange(first);
}
}
follow = follow.Distinct().ToList();
return follow;
}
代码说明
- 对每个归约项目单独计算 follow 集合: 在
SLRAnaly()函数中,使用foreach循环遍历项目集合中每个项目的序号,然后使用SLRobjNum[item]获取项目对象,最后调用GetFollow(node)方法计算每个项目的 follow 集合。 - 特殊情况处理: 在
GetFollow(SLRNode node)方法中,针对E -> T情况进行了特殊处理,因为T可以接着乘法,所以需要将*加入其 follow 集合。对于右部最后一个符号是终结符或非终结符的情况,分别进行不同的处理。
修正后的代码优势
- 更准确的 follow 集合计算: 针对每个归约项目单独计算 follow 集合,避免了错误的 follow 集合导致分析表构建错误。
- 更清晰的代码逻辑: 将 follow 集合的计算逻辑封装在
GetFollow()方法中,使代码更清晰易懂。
通过上述修正,可以确保 SLR1 分析表构建的正确性,并提高代码的可读性和可维护性。
原文地址: https://www.cveoy.top/t/topic/f0JT 著作权归作者所有。请勿转载和采集!