using System;
using System.Collections.Generic;

public class LR
{
    // 产生式结点类
    public class LRNode
    {
        public string Left;
        public string Right;
        public LRNode(string Left, string Right)
        {
            this.Left = Left;
            this.Right = Right;
        }
    }
    // 项目集类
    public class LRitemsets
    {
        public List<int> Container
            = new List<int>(100);
        // 记录项目在项目集合中的序号
    }

    // DFA 结点
    public struct DFA
    {
        public int from;
        public char symbol;
        public int to;
        public DFA(int from, char symbol, int to)
        {
            this.from = from;
            this.symbol = symbol;
            this.to = to;
        }
    }

    // 分析表 结点
    public class Table
    {
        public bool error;// 是否为 ERROR
        public char type;// 结点类型
        public int id;// 数值
        public Table()
        {
            this.error = true;
        }
        public Table(char type, int id)
        {
            this.type = type;
            this.id = id;
            this.error = false;
        }
    }

    
    public DFA[] dfa = new DFA[100];
    public int Pindex = 0; // dfa 数组指针
    public Table[][] LRAna;// 分析表
    public Analyze Jz;
    public bool Success = false;
    public List<LRNode> LRproNum = new List<LRNode>(50);// 产生式 列表
    public List<LRNode> LRobjNum = new List<LRNode>(50);// 项目 列表
    public List<LRitemsets> proitemset = new List<LRitemsets>(100);// 项目集合
    public List<int> Gy_obj = new List<int>(50);// 归约项目序号集合
    public List<int> Gy_itemset = new List<int>(50);// 含有归约项目的集合的序号 的集合
    public List<char> Nchar = new List<char>(50);// 非终结符集合
    public List<char> Echar = new List<char>(50);// 终结符集合

    public string RStr = '';
    public string RStr_obitemset = '';// 输出返回
    public string RStr_DFA = '';
    public string RStr_ANA = '';


    public void Buildprod(string str)
    {

        LRNode Lr;
        int i = 0;
        string left = '';
        string right = '';
        left += 'S'';
        right += str[0];
        Lr = new LRNode(left, right);// 拓广文法开始
        LRproNum.Add(Lr);
        while (i < str.Length)
        {
            left = right = '';// 还原
            int j = i;
            while (i < str.Length && str[i] != '\r' && str[i] != '\n')// 换行符‘\r\n’
            {
                if (str[i] == ' ')
                {
                    i++;
                    continue;
                }
                if (str[i] == '|')                 //  遇到“|”可构造一条产生式
                {
                    Lr = new LRNode(left, right);
                    LRproNum.Add(Lr);
                    right = '';                    // 产生式左边相同 右边重新积累
                    i++;                           // 跳过“|”
                    continue;
                }
                if ((i - j) == 0)
                {
                    if (!exist(Nchar, str[i]))// 如果非终结符集合中不存在 str[i],加入 Nchar  产生式左边 只有非终结符 不必判断终结符
                        Nchar.Add(str[i]);
                    left += str[i++];
                }
                else if (i - j <= 2)
                    i++;
                else
                {
                    if (isFinalsymbol(str[i]) && !exist(Nchar, str[i]))// 如果非终结符集合中不存在 str[i],加入 Nchar  isfinalsymbol 非终结符返回 T 终结符返回 F
                        Nchar.Add(str[i]);
                    else if (!isFinalsymbol(str[i]) && !exist(Echar, str[i]))// 产生式右边 需要判断终结符
                        Echar.Add(str[i]);
                    right += str[i++];
                }

            }// while

            i++;// 跳过换行符
            if (left != '' && right != '')
            {
                Lr = new LRNode(left, right);// 构造每一行最后一个产生式,不存在 '|' 时就是该行产生式本身
                LRproNum.Add(Lr);
            }
        }// while
        Echar.Add('#');

        // 构造项目 对产生式集合 LRproNum 中的所有产生式都循环插 '.'
        LRNode Lobj;
        for (i = 0; i < LRproNum.Count; i++)
        {
            left = '';
            right = '';
            for (int j = 0; j <= LRproNum[i].Right.Length; j++)// j 可以等于 length  项目共 length+1 个
            {
                left = LRproNum[i].Left;
                right = CreObj(LRproNum[i].Right, j);// 在第 j 个位置插入 '.'
                if (j == LRproNum[i].Right.Length && LRobjNum.Count != 1)
                {
                    // 在产生式最后的位置插入. 即为归约项目   项目集中 1 号位置为接受项目
                    Gy_obj.Add(LRobjNum.Count);// 归约项目在项目集中的序号 不用 +1 本身就是从 0 开始的
                }
                Lobj = new LRNode(left, right);
                LRobjNum.Add(Lobj);
                left = '';// 还原
                right = '';
            }
        }
        Creteitemsets();// 项目集
        RStr_obitemset += '\r\n项目集构建:\r\n';
        for (int j = 0; j < proitemset.Count; j++)
        {
            RStr_obitemset += 'I' + j.ToString() + ':' + '\r\n';
            for (i = 0; i < proitemset[j].Container.Count; i++)
            {
                RStr_obitemset += LRobjNum[proitemset[j].Container[i]].Left.ToString() + '->' + LRobjNum[proitemset[j].Container[i]].Right.ToString() + '\r\n';
            }
        }
        // return RStr_obitemset;


    }


    public Table[][] GET_ANA()
    {
        LRAnaly();
        RStr_ANA += '\r\nLR0分析表:\r\n    ';
        int i;
        for (i = 0; i < Echar.Count; i++)
        {
            RStr_ANA += Echar[i].ToString() + '     ';
        }
        for (i = 0; i < Nchar.Count; i++)
        {
            RStr_ANA += Nchar[i].ToString() + '     ';
        }
        RStr_ANA += '\r\n';
        for (i = 0; i < proitemset.Count; i++)
        {
            RStr_ANA += i.ToString() + '  ';
            for (int j = 0; j < Echar.Count + Nchar.Count; j++)
            {

                if (LRAna[i][j].error)
                {
                    RStr_ANA += '  ' + '    ';
                }
                else if (i == 1 && j == Echar.Count - 1)
                {
                    RStr_ANA += 'AC' + '    ';
                }
                else if (LRAna[i][j].type != 'N')
                {
                    RStr_ANA += LRAna[i][j].type.ToString() + LRAna[i][j].id.ToString() + '    ';
                }
                else
                    RStr_ANA += LRAna[i][j].id.ToString() + '    ';
            }
            RStr_ANA += '\r\n';
        }

        return LRAna;

    }
    

    // 求项目集
    public void Creteitemsets()
    {
        List<int> lr_item = new List<int>(100);// 记录项目的序号
        lr_item.Add(0);
        lr_item = Closure(lr_item);// 构造初始项目集 求闭包

        LRitemsets LR_C = new LRitemsets();
        LR_C.Container = lr_item;// 集合----项目集序号的集合
        proitemset.Add(LR_C);// 集合的集合----存放项目集序号集合 的集合


        for (int i = 0; i < proitemset.Count; i++)// 整体集合中 第 i 个项目集
        {
            proitemset[i].Container.Sort();// 排序由小到大 后面用于判断是否存在的比较
            int[] flag = new int[proitemset[i].Container.Count];
            for (int fi = 0; fi < proitemset[i].Container.Count; fi++)// 标志位,用来判断该序号是否已经构造
            {
                flag[fi] = 0;
            }

            for (int j = 0; j < proitemset[i].Container.Count; j++)// 第 i 个项目集的第 j 个项目
            {
                if (flag[j] == 1)// 如果已经访问过 就不再构造 找下一个项目
                    continue;
                int index = proitemset[i].Container[j];
                for (int pi = 0; pi < LRobjNum[index].Right.Length - 1; pi++)// length-1 是避免匹配到 . 在最后的规约项目
                {
                    if (LRobjNum[index].Right[pi] == '.')
                    {

                        List<int> lr2_club = new List<int>(100);// 记录项目的序号
                        char symbol = LRobjNum[index].Right[pi + 1];// 记录 .a 转移状态 a. 的符号 a
                        lr2_club.Add((index + 1));// 如果遇到 .a 形式的项目序号为 index 那么项目 a. 的序号为 index+1
                        for (int m1 = j + 1; m1 < proitemset[i].Container.Count; m1++)
                        {
                            // 在第 i 个项目集中找到了可以移动的 .:.a  重新遍历第 i 个项目集 j 项目之后的 找到同样可以移动 a 的项目集
                            int index2 = proitemset[i].Container[m1];
                            for (int m2 = 0; m2 < LRobjNum[index2].Right.Length - 1; m2++)
                            {
                                if (LRobjNum[index2].Right[m2] == '.' && LRobjNum[index2].Right[m2 + 1] == symbol)
                                {
                                    flag[m1] = 1;// 标记位置为 1 已经访问 之后不再访问
                                    lr2_club.Add(index2 + 1);
                                }
                            }
                        }
                        lr2_club = Closure(lr2_club);// 求闭包
                        int value = isexist(lr2_club);
                        if (value == -1)// -1 表示不存在相同的
                        {
                            for (int m3 = 0; m3 < Gy_obj.Count; m3++)
                            {
                                if (isnexist(lr2_club, Gy_obj[m3]))
                                {
                                    Gy_itemset.Add(proitemset.Count);
                                }
                            }
                            LRitemsets LR_C2 = new LRitemsets();
                            dfa[Pindex++] = new DFA(i, symbol, proitemset.Count);// count 不用加 1  本身从 0 开始
                            LR_C2.Container = lr2_club;
                            proitemset.Add(LR_C2);
                        }
                        else
                        {
                            dfa[Pindex++] = new DFA(i, symbol, value);
                        }
                        break;
                    }
                }
            }// end-forj
        }// end-fori

    }// end-Cre_club

    // 分析表
    public void LRAnaly()
    {
        Table tnode = new Table();

        LRAna = new Table[proitemset.Count][];
        for (int i = 0; i < proitemset.Count; i++)
            LRAna[i] = new Table[Echar.Count + Nchar.Count];

        for (int i = 0; i < proitemset.Count; i++)// 初始化 赋予 ERROR 属性
            for (int j = 0; j < Echar.Count + Nchar.Count; j++)// 为终结符加 r 状态 
                LRAna[i][j] = tnode;

        tnode = new Table('A', 0);
        LRAna[1][FindID(Echar, '#')] = tnode;// 项目集 1 必定是接受项目   构建 [1][#]:acc 的情况 先直接赋值好 dfa 里没有

        for (int i = 0; i < Gy_itemset.Count; i++)
        {
            tnode = new Table('r', Find_pro(LRobjNum[proitemset[Gy_itemset[i]].Container[0]]));// 归约项目 找到原产生式序号 添加状态 r
            for (int j = 0; j < Echar.Count; j++)
            {
                LRAna[Gy_itemset[i]][j] = tnode;
            }
        }

        for (int i = 0; i < Pindex; i++)
        {

            if (isFinalsymbol(dfa[i].symbol))// symbol 为非终结符  添加状态 N
            {
                int CID = FindID(Nchar, dfa[i].symbol);
                tnode = new Table('N', dfa[i].to);
                LRAna[dfa[i].from][CID + Echar.Count] = tnode;
            }
            else // 不是归约项目 添加状态 S
            {
                int CID = FindID(Echar, dfa[i].symbol);
                tnode = new Table('S', dfa[i].to);
                LRAna[dfa[i].from][CID] = tnode;
            }

        }
    }
    // SLR1 分析表构建
    public void SLRAnaly()
    {
        Table tnode = new Table();

        LRAna = new Table[proitemset.Count][];
        for (int i = 0; i < proitemset.Count; i++)
            LRAna[i] = new Table[Echar.Count + Nchar.Count];

        for (int i = 0; i < proitemset.Count; i++)// 初始化 赋予 ERROR 属性
            for (int j = 0; j < Echar.Count + Nchar.Count; j++)// 为终结符加 r 状态 
                LRAna[i][j] = tnode;

        tnode = new Table('A', 0);
        LRAna[1][FindID(Echar, '#')] = tnode;// 项目集 1 必定是接受项目   构建 [1][#]:acc 的情况 先直接赋值好 dfa 里没有

        for (int i = 0; i < proitemset.Count; i++)// 对于每个项目集
        {
            List<int> Gy_obj_in_itemset = new List<int>();
            for (int j = 0; j < proitemset[i].Container.Count; j++)// 对于该项目集中的每个项目
            {
                int index = proitemset[i].Container[j];
                for (int pi = 0; pi < LRobjNum[index].Right.Length - 1; pi++)// length-1 是避免匹配到 . 在最后的规约项目
                {
                    if (LRobjNum[index].Right[pi] == '.')
                    {
                        char symbol = LRobjNum[index].Right[pi + 1];
                        if (isFinalsymbol(symbol))// 如果 . 后面是终结符
                        {
                            int follow_index = FindID(Nchar, LRobjNum[index].Left);// 找到该产生式左部的非终结符
                            List<char> follow_set = Follow(follow_index);// 计算其 Follow 集
                            for (int k = 0; k < follow_set.Count; k++)
                            {
                                int CID = FindID(Echar, follow_set[k]);
                                tnode = new Table('r', Find_pro(LRobjNum[index]));// 将 Follow 集中的所有终结符对应的表项都设为归约状态
                                LRAna[i][CID] = tnode;
                                Gy_obj_in_itemset.Add(Find_pro(LRobjNum[index]));// 记录该项目集中所有的归约项目
                            }
                        }
                        break;
                    }
                }
            }
            if (Gy_obj_in_itemset.Count > 0)// 如果该项目集中有归约项目
            {
                for (int j = 0; j < Echar.Count; j++)
                {
                    int CID = j;
                    if (LRAna[i][CID].error)// 如果该表项是错误状态
                    {
                        tnode = new Table('r', Gy_obj_in_itemset[0]);// 将第一个归约项目的状态设为表项状态
                        for (int k = 1; k < Gy_obj_in_itemset.Count; k++)
                        {
                            tnode = new Table('r', Gy_obj_in_itemset[k]);// 将其他归约项目的状态也设为表项状态
                            LRAna[i][CID] = tnode;
                        }
                    }
                }
            }
        }

        for (int i = 0; i < Pindex; i++)
        {
            if (isFinalsymbol(dfa[i].symbol))// symbol 为非终结符  添加状态 N
            {
                int CID = FindID(Nchar, dfa[i].symbol);
                tnode = new Table('N', dfa[i].to);
                LRAna[dfa[i].from][CID + Echar.Count] = tnode;
            }
            else // 不是归约项目 添加状态 S
            {
                int CID = FindID(Echar, dfa[i].symbol);
                tnode = new Table('S', dfa[i].to);
                LRAna[dfa[i].from][CID] = tnode;
            }
        }
    }
    // 以下为待补充的函数
    // 1. isFinalsymbol(char c): 判断字符 c 是否为终结符
    // 2. exist(List<char> charlist, char c): 判断字符 c 是否存在于字符列表 charlist 中
    // 3. FindID(List<char> charlist, char c): 查找字符 c 在字符列表 charlist 中的索引
    // 4. CreObj(string str, int index): 在字符串 str 的第 index 个位置插入 '.'
    // 5. Closure(List<int> lr_item): 计算项目集合 lr_item 的闭包
    // 6. isexist(List<int> lr_item): 判断项目集合 lr_item 是否已存在于 proitemset 中,如果存在则返回其索引,否则返回 -1
    // 7. isnexist(List<int> lr_item, int index): 判断项目集合 lr_item 中是否包含项目 index
    // 8. Find_pro(LRNode lrnode): 查找产生式 lrnode 在 LRproNum 中的索引
    // 9. Follow(int index): 计算非终结符 index 的 Follow 集

    // ... 函数实现 ...
}
SLR1 分析表构建 - LR0文法代码实现

原文地址: https://www.cveoy.top/t/topic/f0L0 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录