在向量中将整数封装在一起 - 可以更快地完成吗?

时间:2015-04-06 10:50:21

标签: c++ c++11 data-structures bit-manipulation

对于我目前正在制作的数据结构,我需要将整数紧密地打包在一起。这意味着,如果向量中的最大元素是n,我将使用最多lg n位来表示它。因此,我将整数向量视为位列表。我当前的解决方案工作正常 - 但我需要知道我是否可以加快解包整数。该查找操作是我的数据结构的搜索查询中不可或缺的一部分。

// uint is an unsigned 32 bit integer (std::uint32_t)
uint
Data::findInt(const std::vector<uint>& input, int size, int pos) {
    pos = pos*size;
    int end = pos+size;
    int firstc = pos/32;
    int secondc = end/32;
    int ipos = pos % 32;
    int jpos = end % 32;

    if(firstc == secondc) {
        uint number = input.at(firstc);
        number = number >> (32 - end);
        number = number & ((1 << size) - 1);
        return number;
    }
    // else
    uint number = input.at(firstc);
    number = number << (jpos);
    number = number & ((1 << size) -1);
    uint number2 = input.at(secondc);
    number2 = number2 >> (32 - jpos);
    number2 = number2 & ((1 << jpos) - 1);

    return number + number2;
}

std::vector<uint>
Data::packBits(const std::vector<uint>& input, int size) {

    std::vector<char> bits = translatetobits(input, size);
    while(bits.size() % 32 != 0) {
        bits.push_back(0);
    }

    std::vector<uint> packedbits;
    for(int i = 0; i < bits.size(); i += 32) {
        uint res = 0;
        for(int j = 0; j < 31; ++j) {
            res += (bits.at(i+j));
            res = res << 1;
        }
        res += (bits.at(i+31));
        packedbits.push_back(res);
    }

    // Current lookup requires an empty entry - should be fixed
    packedbits.push_back(0);

    return packedbits;
}

我一次只能获取一个整数,并且查找操作的索引会非常随意地跳转,因此我无法一起批量查找。有没有人有加速查询的好主意?

1 个答案:

答案 0 :(得分:1)

检查

at。检查边界一次,而不是每次与矢量的交互。

考虑使用原始指针代替向量进行低级操作。

你的包装效率极低 - 它会进行内存分配。为什么在众神的名字。

您应该使用固定大小的数据,而不是通用uint s。

您有重复的代码计算number。考虑消除。该代码中的常量32是如何打包的位 - 以不同的方式打包,保存操作。

如果需要,您可以优化Branclessness,但这可能不会增加性能(它将授予最坏情况下的性能提升,但不会重复操作,因为分支预测器非常可靠)。一种可能性是始终将数据解压缩为64位无符号类型,然后将其移走:我认为有一些方法可以做到这一点,以便第二次查找只是注入零,或者如果不需要则会被屏蔽掉的数据