C / C ++高效位数组

时间:2010-04-13 21:35:23

标签: c++ c arrays bit

你能推荐有效/干净的方法来操纵任意长度的位数组吗?

现在我正在使用常规的int / char位掩码,但是当数组长度大于数据类型长度时,这些不是很干净。

std vector<bool>无法使用。

10 个答案:

答案 0 :(得分:49)

既然你提到了C和C ++,我会假设面向C ++的解决方案(如boost::dynamic_bitset)可能不适用,而是谈论低级C实现。请注意,如果boost::dynamic_bitset之类的内容适合您,或者您可以找到预先存在的C库,那么使用它们可能比滚动它们更好。

警告:以下代码均未经过测试或编译过,但它应该非常接近您的需要。

首先,假设您有一个固定的位集大小N.然后类似下面这样的工作:

typedef uint32_t word_t;
enum { WORD_SIZE = sizeof(word_t) * 8 };

word_t data[N / 32 + 1];

inline int bindex(int b) { return b / WORD_SIZE; }
inline int boffset(int b) { return b % WORD_SIZE; }

void set_bit(int b) { 
    data[bindex(b)] |= 1 << (boffset(b)); 
}
void clear_bit(int b) { 
    data[bindex(b)] &= ~(1 << (boffset(b)));
}
int get_bit(int b) { 
    return data[bindex(b)] & (1 << (boffset(b));
}
void clear_all() { /* set all elements of data to zero */ }
void set_all() { /* set all elements of data to one */ }

正如所写,这有点粗糙,因为它只实现了一个固定大小的单个全局位集。要解决这些问题,您需要从数据结构开始,如下所示:

struct bitset { word_t *words; int nwords; };

然后编写函数来创建和销毁这些位集。

struct bitset *bitset_alloc(int nbits) {
    struct bitset *bitset = malloc(sizeof(*bitset));
    bitset->nwords = (n / WORD_SIZE + 1);
    bitset->words = malloc(sizeof(*bitset->words) * bitset->nwords);
    bitset_clear(bitset);
    return bitset;
}

void bitset_free(struct bitset *bitset) {
    free(bitset->words);
    free(bitset);
}

现在,修改以前的函数以获取struct bitset *参数相对简单。仍然无法在其生命周期内重新调整bitset的大小,也没有任何边界检查,但此时也不难添加。

答案 1 :(得分:21)

如果长度仅在运行时间中已知,则

boost::dynamic_bitset

std::bitset如果长度在编译时已知(尽管是任意的)。

答案 2 :(得分:13)

我编写了一个基于Dale Hagglund's response的工作实现,以便在C(BSD许可证)中提供一个位数组。

https://github.com/noporpoise/BitArray/

请告诉我您的想法/建议。我希望人们在寻找对这个问题的回答时发现它很有用。

答案 3 :(得分:7)

这个帖子相当陈旧,但我的ALFLB库中有一个高效的位阵列套件。

对于许多没有硬件分割操作码的微控制器,该库是高效的,因为它不使用除法:相反,使用屏蔽和位移。 (是的,我知道有些编译器会将除以8转换为转换,但这会因编译器而异。)

已经在最多2 ^ 32-2位(大约40亿位存储在536 MB)中的阵列上进行了测试,但如果在应用程序的for循环中没有使用,则最后2位应该是可访问的。

请参阅下面的doco提取物。 Doco是http://alfredo4570.net/src/alflb_doco/alflb.pdf,图书馆是http://alfredo4570.net/src/alflb.zip

享受,
ALF

//------------------------------------------------------------------
BM_DECLARE( arrayName, bitmax);
        Macro to instantiate an array to hold bitmax bits.
//------------------------------------------------------------------
UCHAR *BM_ALLOC( BM_SIZE_T bitmax); 
        mallocs an array (of unsigned char) to hold bitmax bits.
        Returns: NULL if memory could not be allocated.
//------------------------------------------------------------------
void BM_SET( UCHAR *bit_array, BM_SIZE_T bit_index);
        Sets a bit to 1.
//------------------------------------------------------------------
void BM_CLR( UCHAR *bit_array, BM_SIZE_T bit_index);
        Clears a bit to 0.
//------------------------------------------------------------------
int BM_TEST( UCHAR *bit_array, BM_SIZE_T bit_index); 
        Returns: TRUE (1) or FALSE (0) depending on a bit.
//------------------------------------------------------------------
int BM_ANY( UCHAR *bit_array, int value, BM_SIZE_T bitmax); 
        Returns: TRUE (1) if array contains the requested value (i.e. 0 or 1).
//------------------------------------------------------------------
UCHAR *BM_ALL( UCHAR *bit_array, int value, BM_SIZE_T bitmax);
        Sets or clears all elements of a bit array to your value. Typically used after a BM_ALLOC.  
        Returns: Copy of address of bit array
//------------------------------------------------------------------
void BM_ASSIGN( UCHAR *bit_array, int value, BM_SIZE_T bit_index);
        Sets or clears one element of your bit array to your value.
//------------------------------------------------------------------
BM_MAX_BYTES( int bit_max); 
        Utility macro to calculate the number of bytes to store bitmax bits.
        Returns: A number specifying the number of bytes required to hold bitmax bits.
//------------------------------------------------------------------

答案 4 :(得分:3)

您可以使用std::bitset

int main() {
  const bitset<12> mask(2730ul); 
  cout << "mask =      " << mask << endl;

  bitset<12> x;

  cout << "Enter a 12-bit bitset in binary: " << flush;
  if (cin >> x) {
    cout << "x =        " << x << endl;
    cout << "As ulong:  " << x.to_ulong() << endl;
    cout << "And with mask: " << (x & mask) << endl;
    cout << "Or with mask:  " << (x | mask) << endl;
  }
}

答案 5 :(得分:2)

我知道这是一个很老的帖子,但我来到这里找到一个简单的C bitset实现,没有一个答案与我想要的完全匹配,所以我根据Dale Hagglund的答案实现了我自己的答案。这是:)

#include <stdio.h>
#include <stdlib.h>
#include <stdint.h>
#include <string.h>

typedef uint32_t word_t;
enum { BITS_PER_WORD = 32 };
struct bitv { word_t *words; int nwords; int nbits; };

struct bitv* bitv_alloc(int bits) {
    struct bitv *b = malloc(sizeof(struct bitv));

    if (b == NULL) {
        fprintf(stderr, "Failed to alloc bitv\n");
        exit(1);
    }

    b->nwords = (bits >> 5) + 1;
    b->nbits  = bits;
    b->words  = malloc(sizeof(*b->words) * b->nwords);

    if (b->words == NULL) {
        fprintf(stderr, "Failed to alloc bitv->words\n");
        exit(1);
    }

    memset(b->words, 0, sizeof(*b->words) * b->nwords);

    return b;
}

static inline void check_bounds(struct bitv *b, int bit) {
    if (b->nbits < bit) {
        fprintf(stderr, "Attempted to access a bit out of range\n");
        exit(1);
    }
}

void bitv_set(struct bitv *b, int bit) {
    check_bounds(b, bit);
    b->words[bit >> 5] |= 1 << (bit % BITS_PER_WORD);
}

void bitv_clear(struct bitv *b, int bit) {
    check_bounds(b, bit);
    b->words[bit >> 5] &= ~(1 << (bit % BITS_PER_WORD));
}

int bitv_test(struct bitv *b, int bit) {
    check_bounds(b, bit);
    return b->words[bit >> 5] & (1 << (bit % BITS_PER_WORD));
}

void bitv_free(struct bitv *b) {
    if (b != NULL) {
        if (b->words != NULL) free(b->words);
        free(b);
    }
}

void bitv_dump(struct bitv *b) {
    if (b == NULL) return;

    for(int i = 0; i < b->nwords; i++) {
        word_t w = b->words[i];

        for (int j = 0; j < BITS_PER_WORD; j++) {
            printf("%d", w & 1);
            w >>= 1;
        }

        printf(" ");
    }

    printf("\n");
}

void test(struct bitv *b, int bit) {
    if (bitv_test(b, bit)) printf("Bit %d is set!\n", bit);
    else                   printf("Bit %d is not set!\n", bit);
}

int main(int argc, char *argv[]) {
    struct bitv *b = bitv_alloc(32);

    bitv_set(b, 1);
    bitv_set(b, 3);
    bitv_set(b, 5);
    bitv_set(b, 7);
    bitv_set(b, 9);
    bitv_set(b, 32);
    bitv_dump(b);
    bitv_free(b);

    return 0;
}

答案 6 :(得分:1)

我用这个:

//#include <bitset>
#include <iostream>
//source http://stackoverflow.com/questions/47981/how-do-you-set-clear-and-toggle-a-single-bit-in-c
#define BIT_SET(a,b) ((a) |= (1<<(b)))
#define BIT_CLEAR(a,b) ((a) &= ~(1<<(b)))
#define BIT_FLIP(a,b) ((a) ^= (1<<(b)))
#define BIT_CHECK(a,b) ((a) & (1<<(b)))

/* x=target variable, y=mask */
#define BITMASK_SET(x,y) ((x) |= (y))
#define BITMASK_CLEAR(x,y) ((x) &= (~(y)))
#define BITMASK_FLIP(x,y) ((x) ^= (y))
#define BITMASK_CHECK(x,y) ((x) & (y))

答案 7 :(得分:1)

我最近发布了BITSCAN,这是一个C ++位字符串库,专门用于快速位扫描操作。 BITSCAN可用here。它在alpha中但仍然经过了很好的测试,因为我近年来在组合优化方面的研究中使用它(例如在BBMC中,这是一种先进的精确最大团队算法)。可以找到与其他众所周知的C ++实现(STL或BOOST)的比较here

我希望你觉得它很有用。欢迎任何反馈。

答案 8 :(得分:1)

  

在微控制器开发中,有时我们需要使用   二维数组(矩阵),元素值仅为[0,1]。那   意味着如果我们使用1个字节作为元素类型,它会大大浪费内存   (微控制器的记忆非常有限)。建议的解决方案是   我们应该使用1位矩阵(元素类型是1位)。

http://htvdanh.blogspot.com/2016/09/one-bit-matrix-for-cc-programming.html

答案 9 :(得分:0)

我最近为此目的实现了一个名为BitContainer的小型仅标头库。 它着重于表现力和编译时能力,可以在这里找到: https://github.com/EddyXorb/BitContainer

这肯定不是查看位数组的经典方法,但对于强类型化目的和命名属性的内存有效表示,可以派上用场。

示例:

constexpr Props props(Prop::isHigh(),Prop::isLow()); // intialize BitContainer of type Props with strong-type Prop

constexpr bool result1 = props.contains(Prop::isTiny()) // false
constexpr bool result2 = props.contains(Prop::isLow())  // true