《编译原理》课程书籍文献（编译原理及实践）附录A 编译器设计方案.pdf_大学文库

374 翁译原理及实践 China-pub.com 下载 4.rar-declaration一pe-specifier ID:lppe-specifier ID【NuM】; 5.type-specifier-int lvoid 6.fun-declaration-type-specifier ID params compound-stmt 7.params-params-list void 8.param-list-param-list,param param 9.param→pe-specifier ID type-specifier ID[】 10.compound-stmt local-declarations statement-list) 11.local-declarations local-declarations var-declaration empty 12.statement-list-statement-list statement empty 13.statementexpression-stmt compound-stmt selection-simt iteration-stmt return-stmt 14.expression-simt-expression 15.selection-stmt -if expression statement if expression statement else statement 16.iteration-stmt-while expression statement 17.return-simt-return return expression; 18.expressionvar=expression simple-expression 19.var -IDID expression 20.simple-expression-additive-expression relop additive-expression additive-expression 21.elop→|>=|=|1= 22.additive-expression-additive-expression addop term term 23.addop→+1- 24.term-term mulop factor factor 25.mlop→*/ 26.factor→（expression)var|call1uw 27.call→tD(amgs) 28.args-arg-list empty 29.arg-list-arg-list,expression expression 对以上每条文法规则，给出了相关语义的简短解释 1.program declaration-list 2.declaration-list-declaration-list declarationdeclaration 3.declarationvar-declaration fun-declaration 程序由声明的列表（或序列）组成，声明可以是函数或变量声明，顺序是任意的。至少必须有一个声明。接下来是语义限制（这些在C中不会出现）。所有的变量和函数在使用前必须声明（这避免了向后backpatching引用)。程序中最后的声明必须是一个函数声明，名字为main。注意，C一缺乏原型，因此声明和定义之间没有区别（像C一样）。 4.var-declaration一ype-specifier ID;lpe-specifier ID【wM】: 5.type-specifier-int void 变量声明或者声明了简单的整数类型变量，或者是基类型为整数的数组变量，索引范围从0到 N0M-1。注意，在C一中仅有的基本类型是整型和空类型。在一个变量声明中，只能使用类型

4. v a r- d e c l a r a t i o n → t y p e - s p e c i f i e r I D ; | t y p e - s p e c i f i e r I D [ N U M ] ; 5. t y p e - s p e c i f i e r → i n t | v o i d 6. f u n - d e c l a r a t i o n → t y p e - s p e c i f i e r I D ( p a r a m s ) | c o m p o u n d - s t m t 7. p a r a m s → p a r a m s-l i s t | v o i d 8. p a r a m - l i s t → p a r a m - l i s t , p a r a m | p a r a m 9. p a r a m → t y p e - s p e c i f i e r I D | t y p e - s p e c i f i e r I D [ ] 10. c o m p o u n d - s t m t → { l o c a l-d e c l a r a t i o ns s t a t e m e n t-l i s t } 11. l o c a l-d e c l a r a t i o ns → l o c a l-d e c l a r a t i o ns v a r- d e c l a r a t i o n | e m p t y 12. s t a t e m e n t-l i s t → s t a t e m e n t-l i s t s t a t e m e n t | e m p t y 13. s t a t e m e n t → e x p re s s i o n-s t m t | c o m p o u n d - s t m t | s e l e c t i o n - s t m t | i t e r a t i o n-s t m t | re t u r n-s t m t 14. e x p re s s i o n-s t m t → e x p re s s i o n ; | ; 15. s e l e c t i o n - s t m t → i f ( e x p re s s i o n ) s t a t e m e n t | i f ( e x p re s s i o n ) s t a t e m e n t e l s e s t a t e m e n t 16. i t e r a t i o n -s t m t → w h i l e ( e x p re s s i o n ) s t a t e m e n t 17. re t u r n -s t m t → return ;| r e t u r n e x p re s s i o n; 18. e x p re s s i o n → v a r = e x p re s s i o n | s i m p l e-e x p re s s i o n 19. v a r → I D | I D [ e x p re s s i o n ] 20. s i m p l e-e x p re s s i o n → a d d i t i v e-e x p re s s i o n re l o p a d d i t i v e-e x p re s s i o n | a d d i t i v e -e x p re s s i o n 21. re l o p → | > = | = = | ! = 22. a d d i t i v e-e x p re s s i o n → a d d i t i v e-e x p re s s i o n a d d o p t e r m | t e r m 23. a d d o p →+ | - 24. t e r m → t e r m m u l o p f a c t o r | f a c t o r 25. m u l o p →* | / 26. f a c t o r → ( e x p re s s i o n ) | v a r | c a l l | N U M 27. c a l l → I D ( a rg s ) 28. a rg s → a rg - l i s t | e m p t y 29. a rg-l i s t → a rg-list , e x p re s s i o n | e x p re s s i o n 对以上每条文法规则，给出了相关语义的简短解释。 1. p ro g r a m → d e c l a r a t i o n - l i s t 2. d e c l a r a t i o n - l i s t → d e c l a r a t i o n - l i s t d e c l a r a t i o n | d e c l a r a t i o n 3. d e c l a r a t i o n → v a r- d e c l a r a t i o n | f u n - d e c l a r a t i o n 程序由声明的列表(或序列)组成，声明可以是函数或变量声明，顺序是任意的。至少必须有一个声明。接下来是语义限制(这些在C中不会出现)。所有的变量和函数在使用前必须声明(这避免了向后b a c k p a t c h i n g引用)。程序中最后的声明必须是一个函数声明，名字为m a i n。注意，C－缺乏原型，因此声明和定义之间没有区别(像C一样)。 4. v a r- d e c l a r a t i o n → t y p e - s p e c i f i e r I D ; | t y p e - s p e c i f i e r I D [ NUM ] ; 5. t y p e - s p e c i f i e r → i n t | v o i d 变量声明或者声明了简单的整数类型变量，或者是基类型为整数的数组变量，索引范围从 0到 N UM -1。注意，在C－中仅有的基本类型是整型和空类型。在一个变量声明中，只能使用类型 3 7 4 编译原理及实践下载

China-pub.com 附录A编译器设计方案 375 下载指示符int。void用于函数声明（参见下面）。也要注意，每个声明只能声明一个变量 6.fun-declaration-type-specifier ID params compound-stmt 7.params-param-list void 8.param-list-param-list,param param 9.param-type-specifier ID type-specifier ID[ 函数声明由返回类型指示符、标识符以及在圆括号内的用逗号分开的参数列表组成，后面跟着一个复合语句，是函数的代码。如果函数的返回类型是vo1,那么函数不返回任何值（即是一个过程)。函数的参数可以是v0i(即没有参数)，或者一列描述函数的参数。参数后面跟着方括号是数组参数，其大小是可变的。简单的整型参数由值传递。数组参数由引用来传递 (也就是指针)，在调用时必须通过数组变量来匹配。注意，类型“函数”没有参数。一个函数参数的作用域等于函数声明的复合语句，函数的每次请求都有一个独立的参数集。函数可以是递归的（对于使用声明允许的范围）。 10.compound-stmt-{local-declarations statement-list 复合语句由用花括号围起来的一组声明和语句组成。复合语句通过用给定的顺序执行语句序列来执行。局部声明的作用域等于复合语句的语句列表，并代替任何全局声明。 11.local-declarationslocal-declarations var-declaration empty 2.statement-liststatement-list statement empty 注意声明和语句列表都可以是空的（非终结符mp表示空字符串，有时写作e。) 13.statement expression-stmi compound-stmt selection-stmt iteration-stmi return-stmt 14.expression-stmt-expression; 表达式语句有一个可选的且后面跟着分号的表达式。这样的表达式通常求出它们一方的结果。因此，这个语句用于赋值和函数调用。 15.selection-stmtf (expression)statement if (expression)statement else statement i语句有通常的语义：表达式进行计算：非0值引起第一条语句的执行：0值引起第二条语句的执行，如果它存在的话。这个规则导致了典型的悬挂else二义性，可以用一种标准的方法解决：els部分通常作为当前if的一个子结构立即分析(“最近嵌套”非二义性规则)。 16.iteration-stmt-while (expression)statement whil语句是C一中唯一的垂复语句。它垂复执行表达式，并且如果表达式的求值为非0，则执行语句，当表达式的值为0时结束。 17.return-stmt-return return expression 返回语句可以返回一个值也可无值返回。函数没有说明为voi就必须返回一个值。函数声明为void就没有返回值。return引起控制返回调用者（如果它在main中，则程序结束） 18.expression-var expression simple-expression 19.var→ID|ID【expression] 表达式是一个变量引用，后面跟着赋值符号（等号）和一个表达式，或者就是一个简单的表达式。赋值有通常的存储语义：找到由"ar表示的变量的地址，然后由赋值符右边的子表达式

指示符i n t。v o i d用于函数声明(参见下面)。也要注意，每个声明只能声明一个变量。 6. f u n - d e c l a r a t i o n → t y p e - s p e c i f i e r I D ( p a r a m s )c o m p o u n d - s t m t 7. p a r a m s → p a r a m - l i s t | v o i d 8. p a r a m-l i s t → p a r a m - l i s t , p a r a m | p a r a m 9. p a r a m → t y p e - s p e c i f i e r I D | t y p e - s p e c i f i e r I D [ ] 函数声明由返回类型指示符、标识符以及在圆括号内的用逗号分开的参数列表组成，后面跟着一个复合语句，是函数的代码。如果函数的返回类型是 v o i d，那么函数不返回任何值(即是一个过程)。函数的参数可以是v o i d (即没有参数)，或者一列描述函数的参数。参数后面跟着方括号是数组参数，其大小是可变的。简单的整型参数由值传递。数组参数由引用来传递 (也就是指针)，在调用时必须通过数组变量来匹配。注意，类型“函数”没有参数。一个函数参数的作用域等于函数声明的复合语句，函数的每次请求都有一个独立的参数集。函数可以是递归的(对于使用声明允许的范围)。 10. c o m p o u n d - s t m t → { l o c a l-d e c l a r a t i o ns s t a t e m e n t-l i s t } 复合语句由用花括号围起来的一组声明和语句组成。复合语句通过用给定的顺序执行语句序列来执行。局部声明的作用域等于复合语句的语句列表，并代替任何全局声明。 11. l o c a l-d e c l a r a t i o ns → l o c a l-d e c l a r a t i o ns v a r- d e c l a r a t i o n | e m p t y 12. s t a t e m e n t-l i s t → s t a t e m e n t-l i s t s t a t e m e n t | e m p t y 注意声明和语句列表都可以是空的(非终结符e m p t y表示空字符串，有时写作。) 13. s t a t e m e n t → e x p re s s i o n-s t m t | c o m p o u n d - s t m t | s e l e c t i o n - s t m t | i t e r a t i o n-s t m t | re t u r n-s t m t 14. e x p re s s i o n-s t m t → e x p re s s i o n; |; 表达式语句有一个可选的且后面跟着分号的表达式。这样的表达式通常求出它们一方的结果。因此，这个语句用于赋值和函数调用。 15. s e l e c t i o n - s t m t → i f (e x p re s s i o n) s t a t e m e n t | i f (e x p re s s i o n) s t a t e m e n t e l s e s t a t e m e n t i f语句有通常的语义：表达式进行计算；非 0值引起第一条语句的执行； 0值引起第二条语句的执行，如果它存在的话。这个规则导致了典型的悬挂 e l s e二义性，可以用一种标准的方法解决：e l s e部分通常作为当前i f的一个子结构立即分析(“最近嵌套”非二义性规则)。 16. i t e r a t i o n-s t m t → w h i l e (e x p re s s i o n) s t a t e m e n t w h i l e语句是C－中唯一的重复语句。它重复执行表达式，并且如果表达式的求值为非 0，则执行语句，当表达式的值为0时结束。 17. re t u r n -s t m t → return ;| r e t u r n e x p re s s i o n; 返回语句可以返回一个值也可无值返回。函数没有说明为 v o i d就必须返回一个值。函数声明为v o i d就没有返回值。r e t u r n引起控制返回调用者(如果它在m a i n中，则程序结束)。 18. e x p re s s i o n → v a r = e x p re s s i o n | s i m p l e-e x p re s s i o n 19. v a r → I D | I D [e x p re s s i o n] 表达式是一个变量引用，后面跟着赋值符号 (等号)和一个表达式，或者就是一个简单的表达式。赋值有通常的存储语义：找到由 v a r表示的变量的地址，然后由赋值符右边的子表达式附录A 编译器设计方案 3 7 5 下载

376 翁译原理及实践 China-pub.com 下载进行求值，子表达式的值存储到给定的地址。这个值也作为整个表达式的值返回。vr是简单的（整型）变量或下标数组变量。负的下标将引起程序停止（与C不同）。然而，不进行下标越界检查。 var表示C一比C的进一步限制。在C中赋值的目标必须是左值(value,左值是可以由许多操作获得的地址。在C一中唯一的左值是由r语法给定的，因此这个种类按照句法进行检查代替像C中那样的类型检查。故在C一中指针运算是禁止的。 20.simple-expressionadditive-expression relop additive-expression additive -expression 21.relop+|>=l==1！= 简单表达式由无结合的关系操作符组成（即无括号的表达式仅有一个关系操作符）。简单表达式在它不包含关系操作符时，其值是加法表达式的值，或者如果关系算式求值为tur,其值为l,求值为false时值为0。 22.additive-expression-additive-expression addop term term 23.addop→+1- 24.termterm mulop factor factor 25.mulop* 加法表达式和项表示了算术操作符的结合性和优先级。符号表示整数除：即任何余数都被截去。 26 factor-(expression)I var call NUM 因子是围在括号内的表达式：或一个变量，求出其变量的值：或者一个函数调用，求出函数的返回值：或者一个心M,其值由扫描器计算。数组变量必须是下标变量，除非表达式由单个D组成，并且以数组为参数在函数调用中使用（如下所示）。 27.cal→rD（amgs） 28.argsarg-list empty 29.arg-list arg-list,expression expres 函数调用的组成是一个ID(函数名)，后面是用括号围起来的参数。参数或者为空，或者由逗号分割的表达式列表组成，表示在一次调用期间分配的参数的值。函数在调用之前必须声明，声明中参数的数目必须等于调用中参数的数目。函数声明中的数组参数必须和一个表达式匹配这个表达式由一个标识符组成表示一个数组变量。最后，上面的规则没有给出输入和输出语句。在C一的定义中必须包含这样的函数，因为与C不同，C一没有独立的编译和链接工具：因此，考虑两个在全局环境中预定义的函数，好像它们已进行了声明： int input(void)(...) void output(int x)(...) inputi函数没有参数，从标准输入设备（通常是键盘）返回一个整数值。output函数接受一个整型参数，其值和一个换行符一起打印到标准输出设备（通常是屏幕）。 A.3C一的程序例子下面的程序输入两个整数，计算并打印出它们的最大公因子

进行求值，子表达式的值存储到给定的地址。这个值也作为整个表达式的值返回。 v a r是简单的(整型)变量或下标数组变量。负的下标将引起程序停止 (与C不同)。然而，不进行下标越界检查。 v a r表示C－比C的进一步限制。在C中赋值的目标必须是左值(l - v a l u e)，左值是可以由许多操作获得的地址。在C－中唯一的左值是由v a r语法给定的，因此这个种类按照句法进行检查，代替像C中那样的类型检查。故在C－中指针运算是禁止的。 20. s i m p l e-e x p re s s i o n → a d d i t i v e-e x p re s s i o n re l o p a d d i t i v e-e x p re s s i o n | a d d i t i v e -e x p re s s i o n 21. re l o p → | > = | = = |! = 简单表达式由无结合的关系操作符组成 (即无括号的表达式仅有一个关系操作符 )。简单表达式在它不包含关系操作符时，其值是加法表达式的值，或者如果关系算式求值为 t u r e，其值为1，求值为f a l s e时值为0。 22. a d d i t i v e-e x p re s s i o n → a d d i t i v e-e x p re s s i o n a d d o p t e r m | t e r m 23. a d d o p → + | - 24. t e r m → t e r m m u l o p f a c t o r | f a c t o r 25. m u l o p → * | / 加法表达式和项表示了算术操作符的结合性和优先级。符号表示整数除；即任何余数都被截去。 26. f a c t o r → (e x p re s s i o n) | v a r | c a l l | N U M 因子是围在括号内的表达式；或一个变量，求出其变量的值；或者一个函数调用，求出函数的返回值；或者一个N U M，其值由扫描器计算。数组变量必须是下标变量，除非表达式由单个ID 组成，并且以数组为参数在函数调用中使用(如下所示)。 27. c a l l → I D ( a rg s ) 28. a rg s → a rg - l i s t | e m p t y 29. a rg - l i s t → a rg-list , e x p re s s i o n | e x p re s s i o n 函数调用的组成是一个I D (函数名)，后面是用括号围起来的参数。参数或者为空，或者由逗号分割的表达式列表组成，表示在一次调用期间分配的参数的值。函数在调用之前必须声明，声明中参数的数目必须等于调用中参数的数目。函数声明中的数组参数必须和一个表达式匹配，这个表达式由一个标识符组成表示一个数组变量。最后，上面的规则没有给出输入和输出语句。在 C－的定义中必须包含这样的函数，因为与C不同，C－没有独立的编译和链接工具；因此，考虑两个在全局环境中预定义的函数，好像它们已进行了声明： int input(void) {...} void output(int x) {...} i n p u t函数没有参数，从标准输入设备 (通常是键盘)返回一个整数值。o u t p u t函数接受一个整型参数，其值和一个换行符一起打印到标准输出设备 (通常是屏幕)。 A.3 C－的程序例子下面的程序输入两个整数，计算并打印出它们的最大公因子。 /* A program to perform Euclid's Algorithm to compute gcd. */ 3 7 6 编译原理及实践下载

378 翁译原理及实践 China-pub.com 下载 80rt(x,0,10): 1■0； whi1e(<10) output(x【i】): 1=1+1: A.4C-语言的Tiny Machine.运行时环境下面的描述采用了8.7节给出的Tiny Machine知识和第7章基于栈的运行时环境的知识。因为C一（与TINY不同）有递归过程，运行时环境必须是基于栈的。环境的组成部分有在dMem顶部的全局区和在它下面的栈，朝下向0增长。因为C一不包含指针或动态分配，因此就不需要堆(heap)。在C一中每个活动记录（或栈结构）的组成如下印指向这里 local vars 这里，fp是当前结构指针(current frame pointer),为便于访问保存在一个寄存器中。ofp(I旧结构指针)是正文第7章中讨论的控制链(controlimk)。在FO(结构偏移)右端的常数是每个存储的指示值的偏移量。值initFO是在一个活动记录中存储区开始的参数和变量的偏移量。因为 Tiny Machine不包含栈指针，对活动记录中所有字段的引用都使用带负结构偏移的fp。例如，如果有下列C一函数声明： int f(int x,int y) int a: 那么x、y和z必须在当前结构中分配，￡程序体代码产生的结构起始偏移量是-5(x、y和z各占一个地址，活动记录的簿记信息占两个地址)。×、y和z的偏移分别是-2、-3和-4。在存储器中全局引用可以用绝对地址找到。然而，像TNY一样，我们更愿意从一个寄有器的偏移量引用这些变量。通过保存一个固定的寄存器实现这一点，称作即，它总是指向最大的地址。因为TM模拟器在执行开始之前把这个地址存储到地址0，启动时g即可以从地址0装入，下面是初始化运行时环境的标准开始序列： 0:LD gp,0(ac)+load gp with maxaddress e) copy gp to fp 0(ac) t clear location o 函数调用也要求在一个调用序列中使用函数体的开始代码地址。我们也希望使用p℃的当前值执行相对转移来调用函数而不是直接转移（这将使代码潜在地可重定位）。程序code,h/

sort (x,0,10); i = 0; while (i < 10) { output(x[i]); i = i + 1; } A.4 C－语言的Tiny Machine运行时环境下面的描述采用了8 . 7节给出的Tiny Machine知识和第7章基于栈的运行时环境的知识。因为C－(与T I N Y不同)有递归过程，运行时环境必须是基于栈的。环境的组成部分有在 d M e m顶部的全局区和在它下面的栈，朝下向 0增长。因为C－不包含指针或动态分配，因此就不需要堆( h e a p )。在C－中每个活动记录(或栈结构)的组成如下这里，f p是当前结构指针(current frame pointer)，为便于访问保存在一个寄存器中。o f p (旧结构指针)是正文第7章中讨论的控制链(control link)。在F O (结构偏移)右端的常数是每个存储的指示值的偏移量。值 i n i t F O是在一个活动记录中存储区开始的参数和变量的偏移量。因为 Tiny Machine不包含栈指针，对活动记录中所有字段的引用都使用带负结构偏移的 f p。例如，如果有下列C－函数声明： int f(int x, int y) { int z; . . . } 那么x、y和z必须在当前结构中分配，f程序体代码产生的结构起始偏移量是- 5 (x、y和z各占一个地址，活动记录的簿记信息占两个地址 )。x、y和z的偏移分别是-2、-3和-4。在存储器中全局引用可以用绝对地址找到。然而，像 T I N Y一样，我们更愿意从一个寄存器的偏移量引用这些变量。通过保存一个固定的寄存器实现这一点，称作 g p，它总是指向最大的地址。因为T M模拟器在执行开始之前把这个地址存储到地址 0，启动时g p可以从地址0装入，下面是初始化运行时环境的标准开始序列： 0: LD gp, 0 ( a c ) * load gp with maxaddress 1: LDA fp, 0 ( g p ) * copy gp to fp 2: ST ac, 0 ( a c ) * clear location 0 函数调用也要求在一个调用序列中使用函数体的开始代码地址。我们也希望使用 p c的当前值执行相对转移来调用函数而不是直接转移 (这将使代码潜在地可重定位 )。程序c o d e . h / 3 7 8 编译原理及实践下载 fp 指向这里

China-pub.coM 379 下载附录A编译器设计方案 code,c中的实用过程emitRAbsi可以用于这个目的（它接受绝对代码地址，并通过使用当前的代码产生地址使其相对化)。例如，假设要调用一个函数，其代码起始地址是27，当前的地址是42。那么代替产生绝对转移 42:LDC pe,27(* 我们将产生 42:LDA pe,-16(pe) 这是因为27-(42+1)=-16。 1)调用序列调用者和被调用者之间的合理划分是：使调用者除了在rtFO地址存储返回指针外，还在新的结构中存储参数的值并创建新的结构。代替存储返回指针本身，调用者把它留在c寄存器中，被调用者把它存储进新的结构。因此，每个函数体必须从在（现在当前的）结构中存储值的代码开始： ST ac,retro(fp) 这在每个调用点保存一条指令。在返回时，每个函数通过执行指令 LD pe,retFo(fp) 用这个返回地址装入P心。相应地，调用者逐个计算参数，在新结构压栈之前把它们压进栈中相应的位置。调用者也必须先把当前的p保存进结构的opFO处。从被调用者返回后，通过把旧的中装入印，调用者丢弃新结构。因此，对有两个参数的函数的调用将产生下列代码： to compute first arg> c offset+1n1tE0(fp】 co +1n1 (Ep) store current fp t (2p to fuction entry LD Ep,ofpFo(fp).pop current frame 2)地址计算因为变量和下标数组都允许出现在赋值表达式的左边，所以在编译期间必须区分地址和值。例如，在语句 a【1】:=a【+1】中，表达式a【i]指的是a【i】的地址，而表达式a【i+1]指的是a在地址i+1处的值。这个区分可以对cGen过程使用一个isAddress参数来实现。当这个参数为真时，cGen产生的代码计算变量的地址，而不是值。对于简单变量的情况，这意味着加上即（全局变量）或(局部变量) 的偏移量并把结果装入到ac: LDA ac,offset (fp)++put address of local var in ac 对于数组变量的情况，这意味着加上相对于数组基地址的索引值，并把结果装入到，如下所述。 3)数组在栈中数组的分配从当前结构偏移量开始，按下标增长的顺序在存储器中向下延伸，如下所示：

c o d e . c中的实用过程e m i t R A b s可以用于这个目的(它接受绝对代码地址，并通过使用当前的代码产生地址使其相对化)。例如，假设要调用一个函数，其代码起始地址是 2 7，当前的地址是4 2。那么代替产生绝对转移 42: LDC pc, 27(*) 我们将产生 42: LDA pc, -16(pc) 这是因为27 - (42 + 1) = -1 6。 1) 调用序列调用者和被调用者之间的合理划分是：使调用者除了在 r e t F O地址存储返回指针外，还在新的结构中存储参数的值并创建新的结构。代替存储返回指针本身，调用者把它留在a c寄存器中，被调用者把它存储进新的结构。因此，每个函数体必须从在 (现在当前的)结构中存储值的代码开始： ST ac, retFO(fp) 这在每个调用点保存一条指令。在返回时，每个函数通过执行指令 LD pc, retFO(fp) 用这个返回地址装入p c。相应地，调用者逐个计算参数，在新结构压栈之前把它们压进栈中相应的位置。调用者也必须先把当前的 f p保存进结构的o f p F O处。从被调用者返回后，通过把旧的f p装入f p，调用者丢弃新结构。因此，对有两个参数的函数的调用将产生下列代码： ST ac, frameoffset+initFO (fp) ST ac, frameoffset+initFO-1 (fp) ST fp, frameoffset+ofpFO (fp) * store current fp LDA fp, frameoffset(fp) * push new frame LDA ac,1(pc) * save return in ac LDA pc, ...(pc) * relative jump to fuction entry LD fp, ofpFO(fp) * pop current frame 2) 地址计算因为变量和下标数组都允许出现在赋值表达式的左边，所以在编译期间必须区分地址和值。例如，在语句 a[i] := a[i+1]; 中，表达式a [ i ]指的是a [ i ]的地址，而表达式a [ i + 1 ]指的是a在地址i + 1处的值。这个区分可以对c G e n过程使用一个i s A d d r e s s参数来实现。当这个参数为真时， c G e n产生的代码计算变量的地址，而不是值。对于简单变量的情况，这意味着加上 g p (全局变量)或f p (局部变量) 的偏移量并把结果装入到a c： LDA ac, offset(fp) ** put address of local var in ac 对于数组变量的情况，这意味着加上相对于数组基地址的索引值，并把结果装入到 a c，如下所述。 3) 数组在栈中数组的分配从当前结构偏移量开始，按下标增长的顺序在存储器中向下延伸，如下所示：附录A 编译器设计方案 3 7 9 下载

380 翁译原理及实践 China-pub.com 下载 A【01 数组A的基本地址 A【21 栈中数组A的元素的分配空间 etc. 注意，数组的地址通过从基地址中减去索引值计算。当一个数组传递给函数时，仅传递基地址。基元素区域的分配只进行一次，并在数组生存期间保持固定。函数参数不包括数组的实际元素，仅仅是地址。因此，数组参数是引用参数。当数组参数在函数内部引用时这将引起异常，因为在存储器中保存的必须看成是它们的基地址而不是值。因此，数组参数计算基地址时使用LD操作代替LDA。 A.5使用C-和TM的编程设计基于本书中讨论的TNY编译器（其清单在附录B中），对于一个学期编译课程来说，要求把一个C一语言的完整的编译器作为设计不是没有道理。这可以进行一些调整，当研究了相关的理论后实现编译器的每个阶段。另一方面，C一编译器的一个或多个部分可以由导师提供，要求学生完成剩余的部分。当时间较短（如1/4学年）或者学生要产生“实际”机器的汇编代码，如 Sparc或PC(在代码生成阶段要求更多的细节)，这就特别有用。对于仅实现C一编译器的一部分这就不怎么有用，因为各部分之间的相互作用和代码测试的能力被限制了。下列分列的任务清单提供了一种安排，要注意每个任务与其他任务都不是独立的，最好完成所有的任务以获得完整的编写编译器的经验。设计 L.实现适合于C一的一个符号表。要求表结构结合作用域信息，用于当各个独立的表链接到一起，或者有一个别除机制，用基于栈的方式操作，如第6章所述。 2.实现一个C一扫描器，或者像DFA用手工进行，或者使用Lx,如第2章所述 3.设计一个C一语法树结构，适合于用分析器产生。 4.实现一个C一分析器（这要求一个C一扫描器），或者使用递归下降用手工进行，或者使用 Yacc,如第4、5章所述。分析器要产生合适的语法树（见设计3） 5.实现C一的语义分析器。分析器的主要要求是，除了在符号表中收集信息外，在使用变量和函数时完成类型检查。因为没有指针或结构，并且仅有的基本类型是整型，类型检查器需要处理的类型是空类型、整型、数组和函数。 6.实现C一的代码产生器，其根据是前一节描述的运行时环境

注意，数组的地址通过从基地址中减去索引值计算。当一个数组传递给函数时，仅传递基地址。基元素区域的分配只进行一次，并在数组生存期间保持固定。函数参数不包括数组的实际元素，仅仅是地址。因此，数组参数是引用参数。当数组参数在函数内部引用时这将引起异常，因为在存储器中保存的必须看成是它们的基地址而不是值。因此，数组参数计算基地址时使用L D操作代替L D A。 A.5 使用C－和T M的编程设计基于本书中讨论的T I N Y编译器(其清单在附录B中)，对于一个学期编译课程来说，要求把一个C－语言的完整的编译器作为设计不是没有道理。这可以进行一些调整，当研究了相关的理论后实现编译器的每个阶段。另一方面， C－编译器的一个或多个部分可以由导师提供，要求学生完成剩余的部分。当时间较短(如1 / 4学年)或者学生要产生“实际”机器的汇编代码，如 S p a r c或P C (在代码生成阶段要求更多的细节)，这就特别有用。对于仅实现C－编译器的一部分这就不怎么有用，因为各部分之间的相互作用和代码测试的能力被限制了。下列分列的任务清单提供了一种安排，要注意每个任务与其他任务都不是独立的，最好完成所有的任务以获得完整的编写编译器的经验。设计 1. 实现适合于C－的一个符号表。要求表结构结合作用域信息，用于当各个独立的表链接到一起，或者有一个删除机制，用基于栈的方式操作，如第 6章所述。 2. 实现一个C－扫描器，或者像D FA用手工进行，或者使用L e x，如第2章所述。 3. 设计一个C－语法树结构，适合于用分析器产生。 4. 实现一个C－分析器(这要求一个C－扫描器)，或者使用递归下降用手工进行，或者使用 Ya c c，如第4、5章所述。分析器要产生合适的语法树(见设计3 )。 5. 实现C－的语义分析器。分析器的主要要求是，除了在符号表中收集信息外，在使用变量和函数时完成类型检查。因为没有指针或结构，并且仅有的基本类型是整型，类型检查器需要处理的类型是空类型、整型、数组和函数。 6. 实现C－的代码产生器，其根据是前一节描述的运行时环境。 3 8 0 编译原理及实践下载数组A的基本地址栈中数组A的元素的分配空间