位压缩结构

时间:2016-05-06 08:34:17

标签: c++ performance bit-manipulation bit-fields

我目前正在研究项目,我需要在向量中存储相当多的(〜十亿单位)结构。我还需要以线性方式迭代该向量,因此我必须通过的数据越少越好。

因此我自然而然地开始优化单一结构的尺寸。例如,如果我有多个bool值,我可以将true / false值存储在单个位中,并将所有bool值压缩为一个char / 16位,无论具有足够的大小。对于某些条目,我只需要20位无符号整数。因此我可以再次压缩这些值。

然后我最终得到这样的东西(注意这只是简化的例子):

class Foo {
private:
    uint32_t m_time;
    uint32_t m_comb;

public:
    Foo(uint32_t t, uint32_t big, uint16_t small, bool is_blue, bool is_nice)
        : m_time(t), m_comb((big << 12) | (small << 2) | (is_blue << 1) | is_nice)
    { }

    uint32_t get_time()  const { return m_time; }
    uint32_t get_big()   const { return m_comb >> 12; }
    uint16_t get_small() const { return m_comb & 0b11111111100; }
    uint16_t is_blue()   const { return m_comb & 0b10; }
    uint16_t is_nice()   const { return m_comb & 0b1; }
};

问题是,这可以通过某种方式使用模板自动化吗?我的想法是,我会插入条目的顺序,所需的位大小,而不是我能够调用get<i>(),这将返回我的第i个结构条目。我的动机是摆脱手动编写代码,因为在我看来,很容易出错。我试图实现这一点,但却无可救药地失败了。

2 个答案:

答案 0 :(得分:2)

您可以使用 bit fields 轻松实现此目标。

class Foo {
private:
    uint32_t m_time;
    uint32_t m_big : 20;
    uint32_t m_small : 10;
    uint32_t m_isblue : 1;
    uint32_t m_isnice : 1;
public:
    Foo(uint32_t t, uint32_t big, uint16_t small, bool is_blue, bool is_nice)
        : m_time(t), m_big(big), m_small(small), m_isblue(is_blue), m_isnice(is_nice)
    { }

    uint32_t get_time()  const { return m_time; }
    uint32_t get_big()   const { return m_big; }
    uint16_t get_small() const { return m_small; }
    uint16_t is_blue()   const { return m_isblue; }
    uint16_t is_nice()   const { return m_isnice; }
};

Online demo显示尺寸。

编辑:其他信息

为了总结这些注释,编译器将位字段打包在一起的方式取决于实现:

  

9.6 / 1 (...)类对象中位域的分配是实现定义的。位域的对齐是   实现定义。比特字段被打包成一些可寻址的字段   分配单位。 [注意:比特字段跨越一些分配单元   机器而不是其他机器。位字段从右到左分配   一些机器,从左到右在其他机器上。 - 后注]

所以你不能保证,但编译器通常最好把它们放在一起。作为一个经验法则,只要您的位字段是连续的并且它们的总位小于您正在使用的基本类型,就很有可能打包最佳。如果需要,您可以微调基本类型,如this online demo所示。

答案 1 :(得分:0)

由于位字段为implementation-defined,我决定编写位读/写功能。当你想在磁盘上存储数据(缓存或其他东西)时它会派上用场。

以下是源代码模拟link

#include <iostream>

bool GetBit(uint32_t num, uint8_t pos)
{
    //check pos < sizeof(num)*8
    return (num >> pos) & 0x1;
}

uint8_t GetByte(uint32_t num, uint8_t pos)
{
    //check pos < sizeof(num)*8
    return (num >> pos) & 0xFF;    
}

uint16_t GetShort(uint32_t num, uint8_t pos)
{
    //check pos < sizeof(num)*8
    return (num >> pos) & 0xFFFF;    
}

uint32_t SetBit(bool val, uint32_t &dest, uint8_t pos)
{
    dest ^= (-val ^ dest) & (1 << pos);
    return dest;
}

uint32_t SetByte(uint8_t val, uint32_t &dest, uint8_t pos)
{
    dest &= ~(0xFF<<pos); //clean
    dest |= val<<pos; //set
    return dest;
}

uint32_t SetShort(uint16_t val, uint32_t &dest, uint8_t pos)
{
    dest &= ~(0xFFFF<<pos); //clean
    dest |= val<<pos; //set
    return dest;
}

void PrintBin(uint32_t s, const char* pszComment)
{
    std::cout << pszComment << ": " << std::endl;
    for (size_t n = 0; n < sizeof(s) * 8; n++)
        std::cout << GetBit(s, n) << ' ';
    std::cout << std::endl;
}

int main()
{
    uint32_t s = 4294967295; //all bits
    PrintBin(s, "Start");

    SetBit(false, s, 2); 
    PrintBin(s, "Set bit 2 to FALSE");

    SetByte(0, s, 22);
    PrintBin(s, "Set byte 22 to val 0");

    SetByte(30, s, 22);
    PrintBin(s, "Set byte 22 to val 30");

    SetShort(0, s, 4);
    PrintBin(s, "Set short 4 to val 0");

    SetShort(65000, s, 4);
    PrintBin(s, "Set short 4 to val 65000");

    std::cout << "byte at 22 = " << (int)GetByte(s, 22) << std::endl;
    std::cout << "short at 4 = " << (int)GetShort(s, 4) << std::endl;    
}

输出:

Start: 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
Set bit 2 to FALSE: 
1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
Set byte 22 to val 0: 
1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 1 1 
Set byte 22 to val 30: 
1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 0 0 0 1 1 
Set short 4 to val 0: 
1 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0 1 1 1 1 0 0 0 1 1 
Set short 4 to val 65000: 
1 1 0 1 0 0 0 1 0 1 1 1 1 0 1 1 1 1 1 1 1 1 0 1 1 1 1 0 0 0 1 1 
byte at 22 = 30
short at 4 = 65000

您可以将这些函数转换为#DEFINE并在调试模式下添加范围检查。