使用C中的YACC对LISP子集进行操作

时间:2010-11-25 21:22:02

标签: c lisp yacc lex

有没有办法在YACC项目中添加2个或更多个操作数,使用C语言为LISP子集构建解析器,这就是语法

“mod”和“let”不区分大小写,也不区分符号

P:
    '('LET '('DEF_VARS')' BODY')'
    |BODY
    ;
DEF_VARS:
    DEF_VARS DEF
    |DEF
    ;
DEF:
    '('SYMBOL OPN')'
    ;
CUERPO:
    BODY EXPR
    |EXPR
    ;
EXPR:
    '('OPER OPNS')'
    ;
OPER:
    '+' 
    |'-'    
    |'*'    
    |MOD    // %
    |'/'    
    ;
OPNS:
    OPNS OPN
    |OPN        
    ;
OPN:
    EXPR        
    |INT    // [-+]?[0-9]+  
    |SYMBOL //[a-zA-Z][a-zA-Z0-9_]*     //a variable
    ;

我想知道如何使用符号表并添加,减去,乘,除和mod,一个元素列表,并声明变量 我不知道如何在代码中使用符号表。

例如,这些句子对语言有效:

(+ 30 -7 +3)

结果是26

(* (+ 3 4) (- -5 2))

结果是-49

( lEt ((x(+ 1 2))(y x))(/ (mod x y) 3))

结果为0

欢迎任何帮助。 提前谢谢。

1 个答案:

答案 0 :(得分:1)

嗯,我看到了几个问题。

首先,我认为非终端CUERPO实际上应该输入BODY,对吗?

其次,该语法实际上不会解析任何这些测试用例。

所有测试用例都需要一个运算符,然后需要多个带有附加运算符的表达式,但是允许运算符的唯一规则也需要新的parens。

现在,你的语法解析:

(+1 2 3 a b fnorq bletch)

和类似的短语......

我建议在添加符号表并实际执行算法之前使语法和解析正确。通过一个工作框架,追捕符号实际值的要求将使符号表的理论,操作和开发更加明显。

我把你的语法变成了一个真正的“工作”程序:

$ cat > lispg.y

%{

  char *yylval;

  int yylex(void);
  void yyerror(char const *);
  #define YYSTYPE char *
  int yydebug = 1;

%}

%token LET
%token SYMBOL
%token INT
%token MOD
%token SYMBOL_TOO_LONG

%%

P:  '('LET '('DEF_VARS')' BODY')'
    |BODY
    ;

DEF_VARS:
    DEF_VARS DEF
    |DEF
    ;
DEF:
    '('SYMBOL OPN')'
    ;
BODY:
    BODY EXPR
    |EXPR
    ;
EXPR:
    '('OPER OPNS')'
    ;
OPER:
    '+' 
    |'-'    
    |'*'    
    |MOD    // %
    |'/'    
    ;
OPNS:
    OPNS OPN
    |OPN        
    ;
OPN:
    EXPR        
    |INT    // [-+]?[0-9]+  
    |SYMBOL //[a-zA-Z][a-zA-Z0-9_]*     //a variable
    ;

%%

#include <stdio.h>
#include <string.h>
#include <stdlib.h>

int parsesym(int c)
{
char *p;
static char sym[100];


  for(p = sym; p < sym + sizeof sym - 1; ) {
    *p++ = c;
    c = getchar();
    if ('a' <= c && c <= 'z')
      c -= 'a' - 'A';
    if ('A' <= c && c <= 'Z' || '0' <= c && c <= '9' || c == '_')
      continue;
    *p++ = '\0';
    ungetc(c, stdin);
    if (strcmp(sym,"LET") == 0)
      return LET;
    yylval = strdup(sym);
    return SYMBOL;
  }
  return SYMBOL_TOO_LONG;
}

int parseint(int c) {
  parsesym(c);
  return INT;
}

int yylex() {
  for(;;) {
    int c;
    switch(c = getchar()) {
      case EOF:
        return 0;
      case ' ':
      case '\n':
      case '\t':
        continue;
      case '(':
      case ')':
      case '+':
      case '-':
      case '*':
      case '/':
        return c;
      case '%':
        return MOD;
      default:
        if('0' <= c && c <= '9')
          return parseint(c);
        if('a' <= c && c <= 'z')
          c -= 'a' - 'A';
        if('A' <= c && c <= 'Z') {
          return parsesym(c);
        }
    }
  }
}
$ yacc  lispg.y && cc -Wall -Wextra -Wno-parentheses y.tab.c -ly
$ echo '(+1 2 3 a b fnorq bletch)' | ./a.out