混淆的C代码竞赛2006.请解释sykes2.c

时间:2013-03-13 18:22:49

标签: c obfuscation deobfuscation

这个C程序如何运作?

main(_){_^448&&main(-~_);putchar(--_%64?32|-~7[__TIME__-_/8%8][">'txiZ^(~z?"-48]>>";;;====~$::199"[_*2&8|_/64]/(_&2?1:8)%8&1:10);}

它按原样编译(在gcc 4.6.3上测试)。它打印编译时的时间。在我的系统上:

    !!  !!!!!!              !!  !!!!!!              !!  !!!!!! 
    !!  !!  !!              !!      !!              !!  !!  !! 
    !!  !!  !!              !!      !!              !!  !!  !! 
    !!  !!!!!!    !!        !!      !!    !!        !!  !!!!!! 
    !!      !!              !!      !!              !!  !!  !! 
    !!      !!              !!      !!              !!  !!  !! 
    !!  !!!!!!              !!      !!              !!  !!!!!!

来源:sykes2 - A clock in one linesykes2 author hints

一些提示:默认情况下没有编译警告。使用-Wall编译,会发出以下警告:

sykes2.c:1:1: warning: return type defaults to ‘int’ [-Wreturn-type]
sykes2.c: In function ‘main’:
sykes2.c:1:14: warning: value computed is not used [-Wunused-value]
sykes2.c:1:1: warning: implicit declaration of function ‘putchar’ [-Wimplicit-function-declaration]
sykes2.c:1:1: warning: suggest parentheses around arithmetic in operand of ‘|’ [-Wparentheses]
sykes2.c:1:1: warning: suggest parentheses around arithmetic in operand of ‘|’ [-Wparentheses]
sykes2.c:1:1: warning: control reaches end of non-void function [-Wreturn-type]

4 个答案:

答案 0 :(得分:1793)

让我们去混淆它。

缩进:

main(_) {
    _^448 && main(-~_);
    putchar(--_%64
        ? 32 | -~7[__TIME__-_/8%8][">'txiZ^(~z?"-48] >> ";;;====~$::199"[_*2&8|_/64]/(_&2?1:8)%8&1
        : 10);
}

引入变量来解开这个混乱:

main(int i) {
    if(i^448)
        main(-~i);
    if(--i % 64) {
        char a = -~7[__TIME__-i/8%8][">'txiZ^(~z?"-48];
        char b = a >> ";;;====~$::199"[i*2&8|i/64]/(i&2?1:8)%8;
        putchar(32 | (b & 1));
    } else {
        putchar(10); // newline
    }
}

请注意-~i == i+1,因为有两个补码。因此,我们有

main(int i) {
    if(i != 448)
        main(i+1);
    i--;
    if(i % 64 == 0) {
        putchar('\n');
    } else {
        char a = -~7[__TIME__-i/8%8][">'txiZ^(~z?"-48];
        char b = a >> ";;;====~$::199"[i*2&8|i/64]/(i&2?1:8)%8;
        putchar(32 | (b & 1));
    }
}

现在,请注意a[b] is the same as b[a],然后再次应用-~ == 1+更改:

main(int i) {
    if(i != 448)
        main(i+1);
    i--;
    if(i % 64 == 0) {
        putchar('\n');
    } else {
        char a = (">'txiZ^(~z?"-48)[(__TIME__-i/8%8)[7]] + 1;
        char b = a >> ";;;====~$::199"[(i*2&8)|i/64]/(i&2?1:8)%8;
        putchar(32 | (b & 1));
    }
}

将递归转换为循环并稍微简化一下:

// please don't pass any command-line arguments
main() {
    int i;
    for(i=447; i>=0; i--) {
        if(i % 64 == 0) {
            putchar('\n');
        } else {
            char t = __TIME__[7 - i/8%8];
            char a = ">'txiZ^(~z?"[t - 48] + 1;
            int shift = ";;;====~$::199"[(i*2&8) | (i/64)];
            if((i & 2) == 0)
                shift /= 8;
            shift = shift % 8;
            char b = a >> shift;
            putchar(32 | (b & 1));
        }
    }
}

每次迭代输出一个字符。每64个字符,它输出一个换行符。否则,它使用一对数据表来确定要输出的内容,并放置字符32(空格)或字符33(!)。第一个表(">'txiZ^(~z?")是一组描述每个字符外观的10个位图,第二个表(";;;====~$::199")选择要从位图显示的相应位。

第二个表

让我们首先检查第二个表int shift = ";;;====~$::199"[(i*2&8) | (i/64)];i/64是行号(6到0),i*2&8是8 iff i是4,5,6或7 mod 8。

if((i & 2) == 0) shift /= 8; shift = shift % 8选择高八进制数字(对于i%8 = 0,1,4,5)或低八进制数字(对于i%8 = 2,3,6,7 )表值。转换表最终看起来像这样:

row col val
6   6-7 0
6   4-5 0
6   2-3 5
6   0-1 7
5   6-7 1
5   4-5 7
5   2-3 5
5   0-1 7
4   6-7 1
4   4-5 7
4   2-3 5
4   0-1 7
3   6-7 1
3   4-5 6
3   2-3 5
3   0-1 7
2   6-7 2
2   4-5 7
2   2-3 3
2   0-1 7
1   6-7 2
1   4-5 7
1   2-3 3
1   0-1 7
0   6-7 4
0   4-5 4
0   2-3 3
0   0-1 7

或以表格形式

00005577
11775577
11775577
11665577
22773377
22773377
44443377

请注意,作者对前两个表项使用了null终止符(偷偷摸摸!)。

这是在七段显示后设计的,7为空白。因此,第一个表中的条目必须定义亮起的段。

第一个表

__TIME__是预处理器定义的特殊宏。它以"HH:MM:SS"的形式扩展为包含预处理器运行时间的字符串常量。注意它包含正好8个字符。请注意,0-9的ASCII值为48到57,:的ASCII值为58.输出为每行64个字符,因此__TIME__每个字符留下8个字符。

7 - i/8%8因此是当前正在输出的__TIME__的索引(需要7-,因为我们向下迭代i)。因此,t是输出__TIME__的字符。

a最终等于二进制中的以下内容,具体取决于输入t

0 00111111
1 00101000
2 01110101
3 01111001
4 01101010
5 01011011
6 01011111
7 00101001
8 01111111
9 01111011
: 01000000

每个数字都是一个位图,用于描述七段显示中亮起的段。由于字符都是7位ASCII,因此始终清除高位。因此,段表中的7始终打印为空白。第二个表看起来像这样,7 s为空白:

000055  
11  55  
11  55  
116655  
22  33  
22  33  
444433  

所以,例如,401101010(第1,3,5和6位),打印为

----!!--
!!--!!--
!!--!!--
!!!!!!--
----!!--
----!!--
----!!--

为了表明我们真正理解代码,让我们用这个表调整一下输出:

  00  
11  55
11  55
  66  
22  33
22  33
  44

这被编码为"?;;?==? '::799\x07"。出于艺术目的,我们将为一些字符添加64(因为只使用低6位,这不会影响输出);这给了"?{{?}}?gg::799G"(注意第8个字符未被使用,所以我们实际上可以做任何我们想要的)。将我们的新表放在原始代码中:

main(_){_^448&&main(-~_);putchar(--_%64?32|-~7[__TIME__-_/8%8][">'txiZ^(~z?"-48]>>"?{{?}}?gg::799G"[_*2&8|_/64]/(_&2?1:8)%8&1:10);}

我们得到了

          !!              !!                              !!   
    !!  !!              !!  !!  !!  !!              !!  !!  !! 
    !!  !!              !!  !!  !!  !!              !!  !!  !! 
          !!      !!              !!      !!                   
    !!  !!  !!          !!  !!      !!              !!  !!  !! 
    !!  !!  !!          !!  !!      !!              !!  !!  !! 
          !!              !!                              !!   
就像我们预期的那样。它不像原版一样坚固,这解释了为什么作者选择使用他所做的表。

答案 1 :(得分:98)

让我们对其进行格式化以便于阅读:

main(_){
  _^448&&main(-~_);
  putchar((--_%64) ? (32|-(~7[__TIME__-_/8%8])[">'txiZ^(~z?"-48]>>(";;;====~$::199")[_*2&8|_/64]/(_&2?1:8)%8&1):10);
}

因此,在没有参数的情况下运行它,_(传统的argc)是1main()将递归调用自身,传递-(~_)的结果(_的负按位NOT),所以它实际上将进行448次递归(仅_^448 == 0的条件)。

考虑到这一点,它将打印7个64字符宽的行(外部三元条件和448/64 == 7)。所以让我们把它改写得更清洁一点:

main(int argc) {
  if (argc^448) main(-(~argc));
  if (argc % 64) {
    putchar((32|-(~7[__TIME__-argc/8%8])[">'txiZ^(~z?"-48]>>(";;;====~$::199")[argc*2&8|argc/64]/(argc&2?1:8)%8&1));
  } else putchar('\n');
}

现在,32对于ASCII空间是十进制的。它要么打印一个空格,要么打印'!' (33是'!',因此最后是'&1')。让我们关注中间的blob:

-(~(7[__TIME__-argc/8%8][">'txiZ^(~z?"-48]) >>
     (";;;====~$::199"[argc*2&8|argc/64]) / (argc&2?1:8) % 8

正如另一张海报所说,__TIME__是程序的编译时间,并且是一个字符串,因此有一些字符串算法正在进行,并且利用数组下标是双向的:a [b]与字符数组的b [a]相同。

7[__TIME__ - (argc/8)%8]

这将选择__TIME__中前8个字符中的一个。然后将其索引到[">'txiZ^(~z?"-48](0-9个字符为48-57十进制)。必须为其ASCII值选择此字符串中的字符。这个相同的字符ASCII代码操作继续通过表达式,导致打印''或'!'取决于角色字形内的位置。

答案 2 :(得分:47)

添加到其他解决方案时,-~x等于x+1,因为~x等同于(0xffffffff-x)。这相当于2s补码中的(-1-x),因此-~x-(-1-x) = x+1

答案 3 :(得分:3)

我尽可能地对模数算术进行去模糊处理并删除了递归

int pixelX, line, digit ;
for(line=6; line >= 0; line--){
  for (digit =0; digit<8; digit++){
    for(pixelX=7;pixelX > 0; pixelX--){ 
        putchar(' '| 1 + ">'txiZ^(~z?"["12:34:56"[digit]-'0'] >> 
          (";;;====~$::199"[pixel*2 & 8  | line] / (pixelX&2 ? 1 : 8) ) % 8 & 1);               
    }
  }
  putchar('\n');
}

进一步扩展:

int pixelX, line, digit, shift;
char shiftChar;
for(line=6; line >= 0; line--){
    for (digit =0; digit<8; digit++){
        for(pixelX=7;pixelX >= 0; pixelX--){ 
            shiftChar = ";;;====~$::199"[pixelX*2 & 8 | line];
            if (pixelX & 2)
                shift = shiftChar & 7;
            else
                shift = shiftChar >> 3;     
            putchar(' '| (">'txiZ^(~z?"["12:34:56"[digit]-'0'] + 1) >> shift & 1 );
        }

    }
    putchar('\n');
}