我写了简单的brainfuck2c翻译器。我添加了一些略微的优化(用于指针移动),但我考虑优化加法/减法,例如我们将++++
这样的代码转换为mem[0]+=1;mem[0]+=1;mem[0]+=1;mem[0]+=1;
。我的目标是让我的解释器优化加法和减法以输出以下代码:mem[0]+=4;
。我编写的代码(仅使用箭头优化);我知道这不是“c ++风格”,但我是C程序员。那么如何实现加法/减法优化呢?我有点google了,但我发现只有python解决方案,我没有使用它们,因为我不理解它们,以及使用外部库(例如LLVM)的解决方案。
#include <string.h>
#include <stdio.h>
#include <stdlib.h>
int main(int argc, char** argv){
int pos = 0;
int amount = 0;
int brackets = 0;
if(argc!=2)exit(0);
FILE* f = fopen(argv[1], "r");
if(f!=NULL){
char* outbuffer = malloc(1024*1024*1024);
char c = fgetc(f);
strcpy(outbuffer, "int getch(void);\nvoid putch(int);\nint main(){\n");
while(!feof(f)){
if(c == '<'){
if(pos==0)pos=65536;
else pos--;
}
if(c == '>'){
if(pos==65536)pos=0;
else pos++;
}
if(c == '['){
brackets++;
sprintf(outbuffer, "while(mem[%d]){", pos);
}
if(c == ']'){
brackets--;
sprintf(outbuffer, "}");
}
if(c == '+'){
sprintf(outbuffer, "mem[%d]+=1;", pos);
}
if(c == '-'){
sprintf(outbuffer, "mem[%d]-=1;", pos);
}
if(c == '.'){
sprintf(outbuffer, "putch(mem[%d]);", pos);
}if(c == '.'){
sprintf(outbuffer, "mem[%d] = getch();", pos);
}
c = fgetc(f);
}
if(brackets == 1){
printf("Compilation succesfull. ");
printf("Generated Code:\n%s", outbuffer);
free(outbuffer);
}
else{
printf("Comilation fault. Unbalanced brackets.");
free(outbuffer);
}
}
}
好的,我找到了答案。我创建了单独的函数;用C后端编写编译器时会很有用;感谢Gene的帮助。
#include <string.h>
#include <stdlib.h>
#include <stdio.h>
int minus(FILE* f){
int c;
int amount = 0;
while ((c = getc(f)) == '-')
amount++;
ungetc(c, f);
return amount;
}
int plus(FILE* f){
int c;
int amount = 0;
while ((c = getc(f)) == '+')
amount++;
ungetc(c, f);
return amount;
}
int main(int argc, char** argv){
int pos = 0;
int brackets = 0;
if(argc!=2)exit(0);
int amount = 1;
FILE* f = fopen(argv[1], "r");
if(f!=NULL){
char* outbuffer = (char*)malloc(1024*1024);
strcpy(outbuffer, "int getch(void);\nvoid putch(int);\nint main(){\n");
while(!feof(f)){
printf("Iterating.");
char c = fgetc(f);
if(c == '<'){
if(pos==0)pos=65536;
else pos--;
}
if(c == '>'){
if(pos==65536)pos=0;
else pos++;
}
if(c == '['){
brackets++;
sprintf(outbuffer, "%swhile(mem[%d]){",outbuffer,pos);
}
if(c == ']'){
brackets--;
sprintf(outbuffer, "%s}", outbuffer);
}
if(c == '+'){
amount = plus(f)+1;
sprintf(outbuffer, "%smem[%d]+=%d;",outbuffer, pos, amount);
}
if(c == '-'){
amount = minus(f)+1;
sprintf(outbuffer, "%smem[%d]-=%d;",outbuffer, pos, amount);
}
if(c == '.'){
sprintf(outbuffer, "%sputch(mem[%d]);",outbuffer, pos);
}
if(c == '.'){
sprintf(outbuffer, "%smem[%d]=getch();",outbuffer, pos);
}
}
if(brackets == 0){
printf("Compilation succesfull. ");
printf("Generated Code:\n%s", outbuffer);
free(outbuffer);
}
else{
printf("Comilation fault. Unbalanced brackets.");
free(outbuffer);
}
}
}
答案 0 :(得分:2)
编译器用于这些简单优化的一般方法是懒惰地生成代码。
不是立即为给定的HLL特征发出代码,而是将其存储在用作缓冲区的方便的数据结构中。在添加每个新的代码块之后,优化器检查缓冲区并应用模式匹配重写规则,这些规则可以降低缓冲代码的成本而不改变其含义。
在您的情况下,规则看起来像X += m; X += n; --> X += (m+n);
。即,将相同l值的两个增量重写为原始两个的总和的单个增量。
另一个简单的例子:X += 0 --> <nothing>
。即,将增量擦除为零。
代码保留在缓冲区中,只要它可能符合其中一条规则。当这不可能时,它最终被发射和删除。
缓冲区有时被称为&#34;窥视孔&#34;进入指令输出流。因此,这种改进代码的方法被称为&#34;窥视孔优化&#34;。你可以通过搜索这个词来学到很多东西。
有很多实现缓冲区的方案。对于表达式,符号操作数堆栈可以很好地工作。对于语句,通常的方法是存储2或3地址代码的FIFO队列,输出代码的抽象表示。