Zig-zag迭代阵列 - 速度优化

时间:2015-03-22 10:47:24

标签: c arrays algorithm embedded

我有一个像这样的数组:

{
  1, 2, 3, 4,
  5, 6, 7, 8,
  9,10,11,12,
 13,14,15,16
}

我需要以锯齿形方式迭代它,例如1,2,3,4, 8,7,6,5, 9...

这很容易,但是开销空间非常小,所以我需要它尽可能节省时间。每个额外的周期都很重要。

这就是我现在所拥有的:

#define send_colors_zigzag(io, colorz, width, height) do {                          \
    for(int8_t y = 0, uu=0, a=1; y < (height); y++, uu+=width, a *= -1) {           \
        uint8_t uup = uu + (a < 0 ? width : 0);                                     \
        for(uint8_t x = 0; x < (width); x++) {                                      \
            uint8_t pos = uup + a*x;                                                \
            const color_t clr = (colorz)[pos];                                      \
            send_one_color(io_pack(io), clr);                                       \
        }                                                                           \
    }                                                                               \
} while(0)

send_one_color是一个宏,它扩展为各个位的循环,我不想在这个宏中重复两次(需要保持它小)。

我有理由将其作为一个宏来进行,ioio_pack是针对别名混淆的一种魔法,无法通过常规函数完成。

我认为它循环正确,但速度不够快(因此无法使用)。

我正在使用8位微信,16MHz。


有关信息,此版本有效(但大内部宏重复两次,我想避免):

#define send_colors_zigzag(io, colorz, width, height) do {                          \
    int8_t x;                                                                       \
    for(int8_t y = 0; y < (height); y++) {                                          \
        for(x = 0; x < (width); x++) {                                              \
            send_one_color(io_pack(io), (colorz)[y*width + x]);                     \
        }                                                                           \
        y++;                                                                        \
        for(x = width-1; x >=0; x--) {                                              \
            send_one_color(io_pack(io), (colorz)[y*width + x]);                     \
        }                                                                           \
    }                                                                               \
} while(0)

1 个答案:

答案 0 :(得分:3)

这是一种避免尽可能多算术的方法,尤其是在内循环中。

color_t* p = (colorz);
for (int8_t y = 0; y < (height); y++) {
    int8_t inc = y & 1 ? -1 : 1;
    if (y) {
        p += (width) + inc;
    }
    for (int8_t x = 0; x < (width); x++) {
        send_one_color(io_pack(io), *p);
        p += inc;
    }
}

如果height是偶数,或者您不介意未定义的行为(因为p点超出colorz的末尾),您可以使用此变体保存几个周期:

color_t* p = (colorz);
for (int8_t y = 0; y < (height); y++) {
    int8_t inc = y & 1 ? -1 : 1;
    for (int8_t x = 0; x < (width); x++) {
        send_one_color(io_pack(io), *p);
        p += inc;
    }
    p += (width) - inc;
}