第五章符号表的组织和管理.ppt
《第五章符号表的组织和管理.ppt》由会员分享,可在线阅读,更多相关《第五章符号表的组织和管理.ppt(25页珍藏版)》请在三一文库上搜索。
1、第五章:符号表的组织和管理,符号表的作用 符号表的主要属性及其作用 符号表的组织结构 名字的作用范围,5.1 符号表的作用,符号表是编译程序中的一个重要的数据结构,它象源程序的一个数据字典,存储了源程序中每个名字及其属性,使用在编译的各个阶段。 (1) 登记符号属性值 在源程序的各个分析阶段,编译程序根据标识符的声明信息收集它属性的有关值,并把它们存放在符合表中。 每种语言规则定义了不同的符号属性;即使是同一个语言,不同的编译程序也可能会定义并且收集不同的属性信息。现代编程语言中一般包括常数声明、变量声明、类型声明和过程/函数声明等四类声明。对于每类声明,编译程序要收集、存储和应用的属性完全不
2、同。,例 C语言的变量声明 short int a; float b = 0.0; 把标识符a声明为短整数型,把b声明为浮点类型,而且初始化为0。那么,编译程序对每个变量要记录它的类型,以便执行类型检查和分配存储,比如短整型变量i占2个字节;要记录它在存储器中的位置(相对位移或绝对地址),以便目标程序运行时访问;若像b有初始值,则还需要记录这个初始值。,(2) 查找符号的属性 符号表存放了源程序中的各种类型的信息,比如数值、变量类型、参数传递的地址等,在分析和翻译源程序的过程中会被不断地查询。 例如,对于上述的变量声明,如果源程序有代码 a + b时,就需要查找、计算表达式中运算数的类型和值,
3、以便计算出表达式。 又如,在源程序中如果出现了函数调用factory (6),编译程序就需要查找到factory的声明,找到实参6的地址并传给形参n,执行函数factory的体,并返回值等。,(2)检查符号的合法性 例如,对于上述声明,代码 a = a + b,C语言的编译将检查变量a和b的类型,把表达式a + b的结果转换成短整型,仅取整数部分进行赋值。 在其它强类型语言,如Pascal和Ada,表达式运算数的类型必须一致,不能进行隐式类型转换,对于这样的表达式a + b,编译程序在语义分析的过程中将发现并报告类型错误的信息。 又如,面向对象语言的继承性和多态性允许同一个消息在不同的环境中调
4、用不同的方法(函数),即调用同名但在不同的类中实现的方法。这就需要编译或者运行时在方法的符号表中查询在参数、返回数以及方法方面名字一致的实现。,(3) 作为目标代码生成阶段地址分配的依据 标识符由它定义的存储类型或它在程序中的位置来确定。 首先是要确定变量存储的区域。例如,在Java语言中,整数的类型(以及所占用的字节)有byte(1个字节)、short(2个字节)、int(4个字节)以及long(8个字节),而float类型占4个字节,double类型占8个字节。又如,对寄存器变量,编译将尽可能地把它们保留在机器的寄存器当中,以提高运行速度;而对在一个文件中定义的外部变量,它们要在不同的源程
5、序文件之间访问,需要编译程序把它们放在所有源程序文件都可以方便寻找到的存储器的位置。 其次,要根据标识符出现的顺序,决定标识符在某个存储区域中的具体位置,而有关区域的标志及其相对位置都是作为该标识符的语义信息存放在它的符号表中的。,5.2 符号表的主要属性及其作用,不同的符号类别包含了不同的属性,由于它们的信息不同,也就导致了符号表的组织有较大的差别。例如,数量类型的变量名字和过程名字: 对于一个变量名要记录其类型(如整型、实型、布尔型等)、占用的存储字节以及相对与某个基准位置的相对位置; 对一个过程名要记录的属性包括参数的个数及其类型,该过程是否有返回值,过程中的变量声明,甚至过程声明(如果
6、像Pascal语言允许嵌套过程声明)等信息。 不同的程序语言规定了符号的不同性质以及语法、语义和规则,几种基本的符号属性。,(1)符号名 语言中的符号名通常用标识符来表示。根据语言的定义,程序中出现的重名标识符定义将按照该标识符在程序中的作用域和可视规则进行相应的处理。而在程序的运行过程中,符号表中的符号名始终是唯一的标志。 在一些允许操作重载、类继承的语言中,函数名、操作名允许重名,对于重载操作的标识符,它们可以通过参数的个数与类型以及返回值的类型来区别;而对于操作的继承,编译器可以构造继承图,同时保存类结构,这样就可以为每个操作和属性找到唯一的定义。 例如,对应不同的参数类型,可以定义几个
7、求和重载函数: int sum ( int a, int b) double sum ( double a, double b) float sum(float a, float b, float c) 当某个函数中调用到重载函数时,编译器根据实参的类型和个数去调用相应的函数。,(2)符号种属 由于语言中符号所拥有的属性可能不同,其组织就可以采用不同的数据结构,可以用符号的种属来区别每个符号的基本划分。 根据不同的语言,符号的种属可以包括:简单变量、结构型变量、数组、过程、类型、类等。 可以依据符号种属的划分来组织符号表,一种方式是为每个种属的标识符建立一张表,这样,可以对符号表类似地安排组织
8、结构、进行同样的操作;另外一种方式把所有种属的标识符统一安排在一张表中,根据符号的种属进行条件判断,对不同种属的特殊型执行不同的存储安排和操作。,(3)符号类型 现代程序语言中的一个重要构造就是数据类型(类型),它是变量标识符的重要属性,函数的数据类型指的是该函数返回值的数据类型。 现代语言通常都有如下的基本类型:整型、实型、字符型、布尔型、逻辑型等; 符号的类型属性从源程序中该符号的定义中得到 变量符号的数据类型属性不但决定了该变量的数据在存储器中的存储格式,也规定了可以对该变量施加的操作运算。,每一个变量的类型是符号表中标识符属性的重要信息。,(4)存储类别 大多数程序语言对变量的存储类别
9、采用两种方式。 一种是用关键字指定,例如,在FORTRAN语言中用COMMON来定义公共存储区域,允许不同程序段都可以访问这些数据;又如,C和C+语言规定static定义的变量属于文件的静态存储变量或属于函数内部的静态存储变量,这些变量在编译时分配存储空间,如果定义时没有初值,编译器还需要将它们初始化为0。 另一种方式是根据定义变量的声明在程序中的位置来决定。例如,C+规定在一个文件中定义的变量缺省为外部的,即程序的公共存储变量;而在函数体内缺省存储类别关键字所定义的变量是内部变量,是属于该函数体所独有的私有存储变量,因而是动态地分配存储空间。 区别符号存储类型地属性是编译过程中语义处理、检查
10、和存储分配的重要依据。 符号的存储类别同时还决定了符号变量的作用域、可见性和它的生命周期等性质 。,(5)作用域 一个标识符在程序中起作用的范围称为其作用域。 一般来说,定义一个符号的位置及存储类型就决定了该符号的作用域,就是它可以出现的场合,可以在程序中作为参数、表达式的运算数等被引用。 C语言中外部变量的作用域是整个程序,一个外部符号的定义在整个策划能够许中只能出现一次,为了方便使用和编译,同名标识符的其它说明可以多次出现。 FORTRAN语言中的COMMON变量的作用域则不是整个程序,而只能在定义这个COMMON块的函数或过程中引用。 面向对象语言,如C+,的每个类都引入了一个独立的类域
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第五 符号 组织 管理
链接地址:https://www.31doc.com/p-2084914.html