LR(0)文法识别与分析 - C# 代码实现
private void button2_Click(object sender, EventArgs e)
{
string str = richTextBox1.Text;
if (str.Length == 0)
{
MessageBox.Show('输入为空');
return;
}
string temp = "";
int i = 0;
while (i < str.Length)
{
temp = "";
while (i < str.Length && str[i] != '\r' && str[i] != '\n')
{
if (str[i] != ' ')
temp += str[i];
i++;
}
i++;
// int j=0;
if (temp.Length > 0 && temp[temp.Length - 1] == '|')
{
MessageBox.Show('不得包含空串!');
return;
}
if (temp.Length > 3)
{
if (temp[0] < 'A' || temp[0] > 'Z')
{
MessageBox.Show('含有非法左部!');
return;
}
if (temp[1] != '-' || temp[2] != '>')
{
MessageBox.Show('产生式输入不规范!');
return;
}
}
if (temp.Length <= 3 && temp.Length > 0)
{
MessageBox.Show('产生式输入不规范!');
return;
}
}
MessageBox.Show('正确的LR(0)文法');
button4.Enabled = true;
button5.Enabled = true;
button6.Enabled = true;
}
// 生成项目族信息
private void button4_Click(object sender, EventArgs e)
{
// ShowDFA.Enabled = true;
step = 0;//单步计数置零
lr = new LR();
listView1.Columns.Clear();
listView1.Items.Clear();
listView1.View = View.Details;
// 添加第一列
listView1.Columns.Add('状态', 150);
listView1.Columns.Add('项目族信息', 350);
lr.Buildprod(richTextBox1.Text);//调用
for (int i = 0; i < lr.proitemset.Count; i++)//输出
{
ListViewItem li = new ListViewItem();
li.SubItems.Clear();
li.SubItems[0].Text = i.ToString();
string tempstr = "";
for (int j = 0; j < lr.proitemset[i].Container.Count; j++)
{
tempstr += lr.LRobjNum[lr.proitemset[i].Container[j]].Left + '->' + lr.LRobjNum[lr.proitemset[i].Container[j]].Right + ' ';
}
li.SubItems.Add(tempstr);
listView1.Items.Add(li);
}
listView1.GridLines = true;
}
// 构造LR分析表
private void button5_Click(object sender, EventArgs e)
{
listView2.Clear();
LR.Table[][] table;
table = lr.GET_ANA();
int xlen = table.GetLength(0);
int ylen = table[1].Length;
listView2.Columns.Clear();
listView2.Items.Clear();
listView2.View = View.Details;
listView2.Columns.Add(' ');
for (int i = 0; i < lr.Echar.Count; i++)//添加表头
{
string text = lr.Echar[i].ToString();
listView2.Columns.Add(text,58);
}
for (int i = 0; i < lr.Nchar.Count; i++)//添加表头
{
string text = lr.Nchar[i].ToString();
listView2.Columns.Add(text,58);
}
for (int i = 0; i < xlen; i++)
{
ListViewItem li = new ListViewItem(i.ToString());
for (int j = 0; j < ylen; j++)
{
string st = "";
if (table[i][j].error)
st = '-';
else if (table[i][j].type == 'A')
st = 'AC';
else
st = table[i][j].type.ToString() + table[i][j].id.ToString();
li.SubItems.Add(st);
}
listView2.Items.Add(li);
}
listView2.GridLines = true;
}
private void button6_Click(object sender, EventArgs e)//分析句子
{
if (textBox1.Text.Length == 0)
{
MessageBox.Show('输入为空,分析失败');
return;
}
// 分析句子
for (int i = 0; i < textBox1.Text.Length; i++)
{
if (!lr.exist(lr.Echar, textBox1.Text[i]))
{
MessageBox.Show('含有未知字符!');
return;
}
}
step = 0;//单步操作置零
listView3.Clear();
listView3.Columns.Clear();
listView3.Items.Clear();
listView3.View = View.Details;
string[] text = { '步骤', '状态栈', '符号栈', '输入串', '所用产生式' };
int[] width = { 45, 70, 70, 70, 100 };
for (int i = 0; i < text.Count(); i++)
{
listView3.Columns.Add(text[i], width[i]);
}
lr.sen_Analyze(textBox1.Text);//调用
if (lr.Success)//判断
MessageBox.Show('分析成功,是该文法的一个句子!');
else
MessageBox.Show('分析失败!');
listView3.GridLines = true;
button7.Enabled = true;
button8.Enabled = true;
}
public void Buildprod(string str)
{
LRNode Lr;
int i = 0;
string left = "";
string right = "";
left += 'S'';
right += str[0];
Lr = new LRNode(left, right);//拓广文法开始
LRproNum.Add(Lr);
while (i < str.Length)
{
left = right = "";//还原
int j = i;
while (i < str.Length && str[i] != '\r' && str[i] != '\n')//换行符‘\r\n’
{
if (str[i] == ' ')
{
i++;
continue;
}
if (str[i] == '|') // 遇到“|”可构造一条产生式
{
Lr = new LRNode(left, right);
LRproNum.Add(Lr);
right = ""; //产生式左边相同 右边重新积累
i++; //跳过“|”
continue;
}
if ((i - j) == 0)
{
if (!exist(Nchar, str[i]))//如果非终结符集合中不存在str[i],加入Nchar 产生式左边 只有非终结符 不必判断终结符
Nchar.Add(str[i]);
left += str[i++];
}
else if (i - j <= 2)
i++;
else
{
if (isFinalsymbol(str[i]) && !exist(Nchar, str[i]))//如果非终结符集合中不存在str[i],加入Nchar isfinalsymbol 非终结符返回T 终结符返回F
Nchar.Add(str[i]);
else if (!isFinalsymbol(str[i]) && !exist(Echar, str[i]))//产生式右边 需要判断终结符
Echar.Add(str[i]);
right += str[i++];
}
}//while
i++;//跳过换行符
if (left != "" && right != "")
{
Lr = new LRNode(left, right);//构造每一行最后一个产生式,不存在"|"时就是该行产生式本身
LRproNum.Add(Lr);
}
}//while
Echar.Add('#');
//构造项目 对产生式集合LRproNum中的所有产生式都循环插'.'
LRNode Lobj;
for (i = 0; i < LRproNum.Count; i++)
{
left = "";
right = "";
for (int j = 0; j <= LRproNum[i].Right.Length; j++)//j可以等于length 项目共length+1个
{
left = LRproNum[i].Left;
right = CreObj(LRproNum[i].Right, j);//在第j个位置插入'.'
if (j == LRproNum[i].Right.Length && LRobjNum.Count != 1)
{//在产生式最后的位置插入. 即为归约项目 项目集中1号位置为接受项目
Gy_obj.Add(LRobjNum.Count);//归约项目在项目集中的序号 不用+1 本身就是从0开始的
}
Lobj = new LRNode(left, right);
LRobjNum.Add(Lobj);
left = "";//还原
right = "";
}
}
Creteitemsets();//项目集
RStr_obitemset += '\r\n项目集构建:\r\n';
for (int j = 0; j < proitemset.Count; j++)
{
RStr_obitemset += 'I' + j.ToString() + ':' + '\r\n';
for (i = 0; i < proitemset[j].Container.Count; i++)
{
RStr_obitemset += LRobjNum[proitemset[j].Container[i]].Left.ToString() + '->' + LRobjNum[proitemset[j].Container[i]].Right.ToString() + '\r\n';
}
}
//return RStr_obitemset;
}
public Table[][] GET_ANA()
{
LRAnaly();
RStr_ANA += '\r\nLR0分析表:\r\n ';
int i;
for (i = 0; i < Echar.Count; i++)
{
RStr_ANA += Echar[i].ToString() + ' ';
}
for (i = 0; i < Nchar.Count; i++)
{
RStr_ANA += Nchar[i].ToString() + ' ';
}
RStr_ANA += '\r\n';
for (i = 0; i < proitemset.Count; i++)
{
RStr_ANA += i.ToString() + ' ';
for (int j = 0; j < Echar.Count + Nchar.Count; j++)
{
if (LRAna[i][j].error)
{
RStr_ANA += ' ' + ' ';
}
else if (i == 1 && j == Echar.Count - 1)
{
RStr_ANA += 'AC' + ' ';
}
else if (LRAna[i][j].type != 'N')
{
RStr_ANA += LRAna[i][j].type.ToString() + LRAna[i][j].id.ToString() + ' ';
}
else
RStr_ANA += LRAna[i][j].id.ToString() + ' ';
}
RStr_ANA += '\r\n';
}
return LRAna;
}
//求项目集
public void Creteitemsets()
{
List<int> lr_item = new List<int>(100);//记录项目的序号
lr_item.Add(0);
lr_item = Closure(lr_item);//构造初始项目集 求闭包
LRitemsets LR_C = new LRitemsets();
LR_C.Container = lr_item;//集合----项目集序号的集合
proitemset.Add(LR_C);//集合的集合----存放项目集序号集合 的集合
for (int i = 0; i < proitemset.Count; i++)//整体集合中 第i个项目集
{
proitemset[i].Container.Sort();//排序由小到大 后面用于判断是否存在的比较
int[] flag = new int[proitemset[i].Container.Count];
for (int fi = 0; fi < proitemset[i].Container.Count; fi++)//标志位,用来判断该序号是否已经构造
{
flag[fi] = 0;
}
for (int j = 0; j < proitemset[i].Container.Count; j++)//第i个项目集的第j个项目
{
if (flag[j] == 1)//如果已经访问过 就不再构造 找下一个项目
continue;
int index = proitemset[i].Container[j];
for (int pi = 0; pi < LRobjNum[index].Right.Length - 1; pi++)//length-1是避免匹配到.在最后的规约项目
{
if (LRobjNum[index].Right[pi] == '.')
{
List<int> lr2_club = new List<int>(100);//记录项目的序号
char symbol = LRobjNum[index].Right[pi + 1];//记录.a转移状态a.的符号a
lr2_club.Add((index + 1));//如果遇到.a形式的项目序号为index 那么项目a.的序号为index+1
for (int m1 = j + 1; m1 < proitemset[i].Container.Count; m1++)
{//在第i个项目集中找到了可以移动的.:.a 重新遍历第i个项目集j项目之后的 找到同样可以移动a的项目集
int index2 = proitemset[i].Container[m1];
for (int m2 = 0; m2 < LRobjNum[index2].Right.Length - 1; m2++)
{
if (LRobjNum[index2].Right[m2] == '.' && LRobjNum[index2].Right[m2 + 1] == symbol)
{
flag[m1] = 1;//标记位置为1 已经访问 之后不再访问
lr2_club.Add(index2 + 1);
}
}
}
lr2_club = Closure(lr2_club);//求闭包
int value = isexist(lr2_club);
if (value == -1)//-1表示不存在相同的
{
for (int m3 = 0; m3 < Gy_obj.Count; m3++)
{
if (isnexist(lr2_club, Gy_obj[m3]))
{
Gy_itemset.Add(proitemset.Count);
}
}
LRitemsets LR_C2 = new LRitemsets();
dfa[Pindex++] = new DFA(i, symbol, proitemset.Count);//count不用加1 本身从0开始
LR_C2.Container = lr2_club;
proitemset.Add(LR_C2);
}
else
{
dfa[Pindex++] = new DFA(i, symbol, value);
}
break;
}
}
}//end-forj
}//end-fori
}//end-Cre_club
//分析表
public void LRAnaly()
{
Table tnode = new Table();
LRAna = new Table[proitemset.Count][];
for (int i = 0; i < proitemset.Count; i++)
LRAna[i] = new Table[Echar.Count + Nchar.Count];
for (int i = 0; i < proitemset.Count; i++)//初始化 赋予ERROR属性
for (int j = 0; j < Echar.Count + Nchar.Count; j++)//为终结符加r状态
LRAna[i][j] = tnode;
tnode = new Table('A', 0);
LRAna[1][FindID(Echar, '#')] = tnode;//项目集1必定是接受项目 构建[1][#]:acc的情况 先直接赋值好 dfa里没有
for (int i = 0; i < Gy_itemset.Count; i++)
{
tnode = new Table('r', Find_pro(LRobjNum[proitemset[Gy_itemset[i]].Container[0]]));//归约项目 找到原产生式序号 添加状态r
for (int j = 0; j < Echar.Count; j++)
{
LRAna[Gy_itemset[i]][j] = tnode;
}
}
for (int i = 0; i < Pindex; i++)
{
if (isFinalsymbol(dfa[i].symbol))//symbol为非终结符 添加状态N
{
int CID = FindID(Nchar, dfa[i].symbol);
tnode = new Table('N', dfa[i].to);
LRAna[dfa[i].from][CID + Echar.Count] = tnode;
}
else //不是归约项目 添加状态S
{
int CID = FindID(Echar, dfa[i].symbol);
tnode = new Table('S', dfa[i].to);
LRAna[dfa[i].from][CID] = tnode;
}
}
}
上述代码中对LR0文法的判别并未考虑到移进规约、规约规约冲突问题,给出需要修改的LRAnaly()函数的代码部分内容:public void LRAnaly()
{
Table tnode = new Table();
LRAna = new Table[proitemset.Count][];
for (int i = 0; i < proitemset.Count; i++)
LRAna[i] = new Table[Echar.Count + Nchar.Count];
for (int i = 0; i < proitemset.Count; i++)//初始化 赋予ERROR属性
for (int j = 0; j < Echar.Count + Nchar.Count; j++)//为终结符加r状态
LRAna[i][j] = tnode;
tnode = new Table('A', 0);
LRAna[1][FindID(Echar, '#')] = tnode;//项目集1必定是接受项目 构建[
原文地址: https://www.cveoy.top/t/topic/fZVs 著作权归作者所有。请勿转载和采集!