SLR语法分析表的构造方法

首先,需要对文法进行拓广,构造出拓广文法的LR(0)项目集规范族C和活前缀识别自动机的状态转换函数GO。然后,根据规则1至4,构造ACTION和GOTO表。具体步骤如下:

  1. 构造拓广文法的LR(0)项目集规范族C和状态转换函数GO。

  2. 对于每个项目集I,遍历其中的每个项目A → α•Bβ,对于每个终结符a,如果GO(I, a) = J,则将ACTION[I, a]设置为'移进J',记为'sj';如果B = ε,则对于每个b ∈ FOLLOW(B),将ACTION[I, b]设置为'用产生式A → αB进行归约',记为'rj';如果A = S'且B = ε,则将ACTION[I, #]设置为'接受',记为'acc'。

  3. 对于每个非终结符A和每个项目集I,如果GO(I, A) = J,则将GOTO[I, A]设置为J。

  4. 如果一个格子既不是'移进'也不是'归约',则填上'出错标志'。

  5. 分析器的初始状态是包含S' →•S的项目集合的状态。

最终得到的SLR分析表就是由ACTION和GOTO表组成的二维数组。在SLRAnaly函数中,可以根据上述步骤,依次构造出SLR分析表。具体实现可以参考以下伪代码:

public void SLRAnaly()
{
    // 构造LR(0)项目集规范族C和状态转换函数GO
    // ...

    // 构造ACTION表
    for (int i = 0; i < C.Count; i++)
    {
        for (int j = 0; j < terminals.Count; j++)
        {
            char a = terminals[j];
            int k = GO[i, a];
            if (k != -1)
            {
                if (isTerminal(a))
                {
                    ACTION[i, a] = new Table('s', k);
                }
                else
                {
                    ACTION[i, a] = new Table('g', k);
                }
            }
        }
        for (int j = 0; j < nonterminals.Count; j++)
        {
            char A = nonterminals[j];
            int k = GO[i, A];
            if (k != -1)
            {
                GOTO[i, A] = k;
            }
        }
        foreach (int item in C[i])
        {
            if (SLRproNum[item].Right.Length == SLRobjNum[item].Right.Length && SLRproNum[item].Right[0] != 'S')
            {
                foreach (char b in FOLLOW[SLRproNum[item].Left])
                {
                    if (isTerminal(b))
                    {
                        ACTION[i, b] = new Table('r', item);
                    }
                }
            }
            else if (SLRproNum[item].Right.Length == SLRobjNum[item].Right.Length + 1 && SLRproNum[item].Right[0] != 'S')
            {
                ACTION[i, SLRproNum[item].Right[SLRobjNum[item].Right.Length]] = new Table('r', item);
            }
            else if (SLRproNum[item].Left == 'S'' && SLRproNum[item].Right.Length == 1 && SLRproNum[item].Right[0] == 'S')
            {
                ACTION[i, '#'] = new Table('a', 0);
            }
        }
    }

    // 输出SLR分析表
    for (int i = 0; i < C.Count; i++)
    {
        for (int j = 0; j < terminals.Count; j++)
        {
            char a = terminals[j];
            if (ACTION[i, a] != null)
            {
                Console.Write('ACTION[' + i + ', ' + a + '] = ');
                if (ACTION[i, a].error)
                {
                    Console.WriteLine('error');
                }
                else if (ACTION[i, a].type == 's')
                {
                    Console.WriteLine('shift ' + ACTION[i, a].id);
                }
                else if (ACTION[i, a].type == 'r')
                {
                    Console.WriteLine('reduce ' + ACTION[i, a].id);
                }
                else if (ACTION[i, a].type == 'a')
                {
                    Console.WriteLine('accept');
                }
            }
        }
        for (int j = 0; j < nonterminals.Count; j++)
        {
            char A = nonterminals[j];
            int k = GOTO[i, A];
            if (k != -1)
            {
                Console.WriteLine('GOTO[' + i + ', ' + A + '] = ' + k);
            }
        }
    }
}

以下是用C#实现SLR分析表构建功能的代码示例:

class SLR
{
    // 产生式结点类
    public class SLRNode
    {
        public string Left;
        public string Right;
        public SLRNode(string Left, string Right)
        {
            this.Left = Left;
            this.Right = Right;
        }
    }
    // 项目集类
    public class SLRitemsets
    {
        public List<int> Container
            = new List<int>(100);
        // 记录项目在项目集合中的序号
    }

    // DFA结点
    public struct DFA
    {
        public int from;
        public char symbol;
        public int to;
        public DFA(int from, char symbol, int to)
        {
            this.from = from;
            this.symbol = symbol;
            this.to = to;
        }
    }

    // 分析表 结点
    public class Table
    {
        public bool error;//是否为ERROR
        public char type;//结点类型
        public int id;//数值
        public Table()
        {
            this.error = true;
        }
        public Table(char type, int id)
        {
            this.type = type;
            this.id = id;
            this.error = false;
        }
    }

    public DFA[] dfa = new DFA[100];
    public int Pindex = 0; //dfa数组指针
    public Table[][] SLRAna;//分析表
    public List<SLRNode> SLRproNum = new List<SLRNode>(50);//产生式 列表
    public List<SLRNode> SLRobjNum = new List<SLRNode>(50);//项目 列表
    public List<SLRitemsets> proitemset = new List<SLRitemsets>(100);//项目集合
    public List<int> Gy_obj = new List<int>(50);//归约项目序号集合
    public List<int> Gy_itemset = new List<int>(50);//含有归约项目的集合的序号 的集合
    public List<char> Nchar = new List<char>(50);//非终结符集合
    public List<char> Echar = new List<char>(50);//终结符集合

    public void Buildprod(string str)
    {

        SLRNode SLr;
        int i = 0;
        string left = '';
        string right = '';
        left += 'S';
        right += str[0];
        SLr = new SLRNode(left, right);//拓广文法开始
        SLRproNum.Add(SLr);
        while (i < str.Length)
        {
            left = right = '';//还原
            int j = i;
            while (i < str.Length && str[i] != '\r' && str[i] != '\n')//换行符'\r\n'
            {
                if (str[i] == ' ')
                {
                    i++;
                    continue;
                }
                if (str[i] == '|')                 //  遇到'|'可构造一条产生式
                {
                    SLr = new SLRNode(left, right);
                    SLRproNum.Add(SLr);
                    right = '';                    //产生式左边相同 右边重新积累
                    i++;                           //跳过'|'
                    continue;
                }
                if ((i - j) == 0)
                {
                    if (!exist(Nchar, str[i]))//如果非终结符集合中不存在str[i],加入Nchar  产生式左边 只有非终结符 不必判断终结符
                        Nchar.Add(str[i]);
                    left += str[i++];
                }
                else if (i - j <= 2)
                    i++;
                else
                {
                    if (isFinalsymbol(str[i]) && !exist(Nchar, str[i]))//如果非终结符集合中不存在str[i],加入Nchar  isfinalsymbol 非终结符返回T 终结符返回F
                        Nchar.Add(str[i]);
                    else if (!isFinalsymbol(str[i]) && !exist(Echar, str[i]))//产生式右边 需要判断终结符
                        Echar.Add(str[i]);
                    right += str[i++];
                }


            }//while

            i++;//跳过换行符
            if (left != '' && right != '')
            {
                SLr = new SLRNode(left, right);//构造每一行最后一个产生式,不存在'|'时就是该行产生式本身
                SLRproNum.Add(SLr);
            }
        }//while
        Echar.Add('#');

        //构造项目 对产生式集合LRproNum中的所有产生式都循环插'.'
        SLRNode Lobj;
        for (i = 0; i < SLRproNum.Count; i++)
        {
            left = '';
            right = '';
            for (int j = 0; j <= SLRproNum[i].Right.Length; j++)//j可以等于length  项目共length+1个
            {
                left = SLRproNum[i].Left;
                right = CreObj(SLRproNum[i].Right, j);//在第j个位置插入'.'
                if (j == SLRproNum[i].Right.Length && SLRobjNum.Count != 1)
                {
                    //在产生式最后的位置插入. 即为归约项目   项目集中1号位置为接受项目
                    Gy_obj.Add(SLRobjNum.Count);//归约项目在项目集中的序号 不用+1 本身就是从0开始的
                }
                Lobj = new SLRNode(left, right);
                SLRobjNum.Add(Lobj);
                left = '';//还原
                right = '';
            }
        }
        Creteitemsets();//项目集
        RStr_obitemset += '\r\n项目集构建:\r\n';
        for (int j = 0; j < proitemset.Count; j++)
        {
            RStr_obitemset += 'I' + j.ToString() + ':' + '\r\n';
            for (i = 0; i < proitemset[j].Container.Count; i++)
            {
                RStr_obitemset += SLRobjNum[proitemset[j].Container[i]].Left.ToString() + '->' + SLRobjNum[proitemset[j].Container[i]].Right.ToString() + '\r\n';
            }
        }
    }

    //求项目集
    public void Creteitemsets()
    {
        List<int> lr_item = new List<int>(100);//记录项目的序号
        lr_item.Add(0);
        lr_item = Closure(lr_item);//构造初始项目集 求闭包

        SLRitemsets LR_C = new SLRitemsets();
        LR_C.Container = lr_item;//集合----项目集序号的集合
        proitemset.Add(LR_C);//集合的集合----存放项目集序号集合 的集合


        for (int i = 0; i < proitemset.Count; i++)//整体集合中 第i个项目集
        {
            proitemset[i].Container.Sort();//排序由小到大 后面用于判断是否存在的比较
            int[] flag = new int[proitemset[i].Container.Count];
            for (int fi = 0; fi < proitemset[i].Container.Count; fi++)//标志位,用来判断该序号是否已经构造
            {
                flag[fi] = 0;
            }

            for (int j = 0; j < proitemset[i].Container.Count; j++)//第i个项目集的第j个项目
            {
                if (flag[j] == 1)//如果已经访问过 就不再构造 找下一个项目
                    continue;
                int index = proitemset[i].Container[j];
                for (int pi = 0; pi < SLRobjNum[index].Right.Length - 1; pi++)//length-1是避免匹配到.在最后的规约项目
                {
                    if (SLRobjNum[index].Right[pi] == '.')
                    {

                        List<int> lr2_club = new List<int>(100);//记录项目的序号
                        char symbol = SLRobjNum[index].Right[pi + 1];//记录.a转移状态a.的符号a
                        lr2_club.Add((index + 1));//如果遇到.a形式的项目序号为index 那么项目a.的序号为index+1
                        for (int m1 = j + 1; m1 < proitemset[i].Container.Count; m1++)
                        {
                            //在第i个项目集中找到了可以移动的.:.a  重新遍历第i个项目集j项目之后的 找到同样可以移动a的项目集
                            int index2 = proitemset[i].Container[m1];
                            for (int m2 = 0; m2 < SLRobjNum[index2].Right.Length - 1; m2++)
                            {
                                if (SLRobjNum[index2].Right[m2] == '.' && SLRobjNum[index2].Right[m2 + 1] == symbol)
                                {
                                    flag[m1] = 1;//标记位置为1 已经访问 之后不再访问
                                    lr2_club.Add(index2 + 1);
                                }
                            }
                        }
                        lr2_club = Closure(lr2_club);//求闭包
                        int value = isexist(lr2_club);
                        if (value == -1)//-1表示不存在相同的
                        {
                            for (int m3 = 0; m3 < Gy_obj.Count; m3++)
                            {
                                if (isnexist(lr2_club, Gy_obj[m3]))
                                {
                                    Gy_itemset.Add(proitemset.Count);
                                }
                            }
                            SLRitemsets LR_C2 = new SLRitemsets();
                            dfa[Pindex++] = new DFA(i, symbol, proitemset.Count);//count不用加1  本身从0开始
                            LR_C2.Container = lr2_club;
                            proitemset.Add(LR_C2);
                        }
                        else
                        {
                            dfa[Pindex++] = new DFA(i, symbol, value);
                        }
                        break;
                    }
                }
            }
        }

    }

    //分析表

    public void SLRAnaly()
    {

    }
    //内部方法
    public string CreObj(string str, int i)
    {
        string res = '';
        for (int j = 0; j < str.Length; j++)
        {
            if (j == i)
            {
                res += '.';
            }
            res += str[j];
        }
        return res;
    }
    public bool exist(List<char> list, char c)
    {
        for (int i = 0; i < list.Count; i++)
        {
            if (list[i] == c)
                return true;
        }
        return false;
    }
    public bool isFinalsymbol(char c)
    {
        if (c >= 'A' && c <= 'Z')
            return true;
        return false;
    }
    public List<int> Closure(List<int> list)
    {
        List<int> res = new List<int>(100);
        for (int i = 0; i < list.Count; i++)
        {
            res.Add(list[i]);
        }
        int index = 0;
        while (index < res.Count)
        {
            int cur = res[index];
            for (int j = 0; j < SLRobjNum[cur].Right.Length - 1; j++)
            {
                if (SLRobjNum[cur].Right[j] == '.')
                {
                    if (!exist(res, cur + 1))
                        res.Add(cur + 1);
                    for (int k = 0; k < SLRproNum.Count; k++)
                    {
                        if (SLRproNum[k].Left == SLRobjNum[cur].Right[j + 1].ToString() && !exist(res, SLRobjNum.IndexOf(new SLRNode(SLRproNum[k].Left, '.' + SLRproNum[k].Right))))
                            res.Add(SLRobjNum.IndexOf(new SLRNode(SLRproNum[k].Left, '.' + SLRproNum[k].Right)));
                    }
                }
            }
            index++;
        }
        return res;
    }
    public int isexist(List<int> list)
    {
        for (int i = 0; i < proitemset.Count; i++)
        {
            proitemset[i].Container.Sort();//排序由小到大 后面用于判断是否存在的比较
            if (isnexist(proitemset[i].Container, list))
                return i;
        }
        return -1;
    }
    public bool isnexist(List<int> list, List<int> list2)
    {
        if (list.Count != list2.Count)
            return false;
        for (int i = 0; i < list.Count; i++)
        {
            if (!exist(list2, list[i]))
                return false;
        }
        return true;
    }
    public bool isnexist(List<int> list, int c)
    {
        for (int i = 0; i < list.Count; i++)
        {
            if (list[i] == c)
                return true;
        }
        return false;
    }
}

注意:

  • 以上代码示例中,FOLLOWterminalsnonterminals 是需要根据具体文法进行定义的变量。
  • 代码中使用了isTerminal函数来判断一个字符是否为终结符,需要根据具体文法进行实现。
  • SLRAnaly函数是一个空函数,需要根据实际需求进行填充。
  • 该代码示例仅仅展示了SLR分析表构建的基本步骤,实际使用中可能还需要进行更多的处理。

参考文献:

SLR语法分析表的构造方法 - 实现SLR分析表构建

原文地址: https://www.cveoy.top/t/topic/f1Re 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录