BF编译器优化

时间:2016-10-29 16:11:04

标签: c compiler-optimization

我写了简单的brainfuck2c翻译器。我添加了一些略微的优化(用于指针移动),但我考虑优化加法/减法,例如我们将++++这样的代码转换为mem[0]+=1;mem[0]+=1;mem[0]+=1;mem[0]+=1;。我的目标是让我的解释器优化加法和减法以输出以下代码:mem[0]+=4;。我编写的代码(仅使用箭头优化);我知道这不是“c ++风格”,但我是C程序员。那么如何实现加法/减法优化呢?我有点google了,但我发现只有python解决方案,我没有使用它们,因为我不理解它们,以及使用外部库(例如LLVM)的解决方案。

#include <string.h>
#include <stdio.h>
#include <stdlib.h>

int main(int argc, char** argv){
    int pos = 0;
    int amount = 0;
    int brackets = 0;
    if(argc!=2)exit(0);
    FILE* f = fopen(argv[1], "r");
    if(f!=NULL){
        char* outbuffer = malloc(1024*1024*1024);
        char c = fgetc(f);
        strcpy(outbuffer, "int getch(void);\nvoid putch(int);\nint main(){\n");
        while(!feof(f)){
            if(c == '<'){
                if(pos==0)pos=65536;
                else pos--;
            }
            if(c == '>'){
                if(pos==65536)pos=0;
                else pos++;
            }
            if(c == '['){
                brackets++;
                sprintf(outbuffer, "while(mem[%d]){", pos);
            }
            if(c == ']'){
                brackets--;
                sprintf(outbuffer, "}");
            }
            if(c == '+'){
                sprintf(outbuffer, "mem[%d]+=1;", pos);
            }
            if(c == '-'){
                sprintf(outbuffer, "mem[%d]-=1;", pos);
            }
            if(c == '.'){
                sprintf(outbuffer, "putch(mem[%d]);", pos);
            }if(c == '.'){
                sprintf(outbuffer, "mem[%d] = getch();", pos);
            }
            c = fgetc(f);
        }
        if(brackets == 1){
            printf("Compilation succesfull. ");
            printf("Generated Code:\n%s", outbuffer);
            free(outbuffer);
        }
        else{
            printf("Comilation fault. Unbalanced brackets.");
            free(outbuffer);
        }
    }
}

好的,我找到了答案。我创建了单独的函数;用C后端编写编译器时会很有用;感谢Gene的帮助。

#include <string.h>
#include <stdlib.h>
#include <stdio.h>

int minus(FILE* f){
    int c;
    int amount = 0;
    while ((c = getc(f)) == '-')
        amount++;
    ungetc(c, f);
    return amount;
}

int plus(FILE* f){
    int c;
    int amount = 0;
    while ((c = getc(f)) == '+')
        amount++;
    ungetc(c, f);
    return amount;
}

int main(int argc, char** argv){
    int pos = 0;
    int brackets = 0;
    if(argc!=2)exit(0);
    int amount = 1;
    FILE* f = fopen(argv[1], "r");
    if(f!=NULL){
        char* outbuffer = (char*)malloc(1024*1024);
        strcpy(outbuffer, "int getch(void);\nvoid putch(int);\nint main(){\n");
        while(!feof(f)){
            printf("Iterating.");
            char c = fgetc(f);
            if(c == '<'){
                if(pos==0)pos=65536;
                else pos--;
            }
            if(c == '>'){
                if(pos==65536)pos=0;
                else pos++;
            }
            if(c == '['){
                brackets++;
                sprintf(outbuffer, "%swhile(mem[%d]){",outbuffer,pos);
            }
            if(c == ']'){
                brackets--;
                sprintf(outbuffer, "%s}", outbuffer);
            }
            if(c == '+'){
                amount = plus(f)+1;
                sprintf(outbuffer, "%smem[%d]+=%d;",outbuffer, pos, amount);
            }
            if(c == '-'){
                amount = minus(f)+1;
                sprintf(outbuffer, "%smem[%d]-=%d;",outbuffer, pos, amount);
            }
            if(c == '.'){
                sprintf(outbuffer, "%sputch(mem[%d]);",outbuffer, pos);
            }
            if(c == '.'){
                sprintf(outbuffer, "%smem[%d]=getch();",outbuffer, pos);
            }
        }
        if(brackets == 0){
            printf("Compilation succesfull. ");
            printf("Generated Code:\n%s", outbuffer);
            free(outbuffer);
        }
        else{
            printf("Comilation fault. Unbalanced brackets.");
            free(outbuffer);
        }
    }
}

1 个答案:

答案 0 :(得分:2)

编译器用于这些简单优化的一般方法是懒惰地生成代码。

不是立即为给定的HLL特征发出代码,而是将其存储在用作缓冲区的方便的数据结构中。在添加每个新的代码块之后,优化器检查缓冲区并应用模式匹配重写规则,这些规则可以降低缓冲代码的成本而不改变其含义。

在您的情况下,规则看起来像X += m; X += n; --> X += (m+n);。即,将相同l值的两个增量重写为原始两个的总和的单个增量。

另一个简单的例子:X += 0 --> <nothing>。即,将增量擦除为零。

代码保留在缓冲区中,只要它可能符合其中一条规则。当这不可能时,它最终被发射和删除。

缓冲区有时被称为&#34;窥视孔&#34;进入指令输出流。因此,这种改进代码的方法被称为&#34;窥视孔优化&#34;。你可以通过搜索这个词来学到很多东西。

有很多实现缓冲区的方案。对于表达式,符号操作数堆栈可以很好地工作。对于语句,通常的方法是存储2或3地址代码的FIFO队列,输出代码的抽象表示。