是否有比使用for循环更好(更快/更有效)的方法对大内存块执行按位操作?在查看选项之后,我注意到std有一个成员std::bitset
,并且还想知道在不更改其值的情况下将大内存区域转换为bitset会更好(甚至可能),然后执行操作,然后将其类型切换回正常状态?
编辑/更新:我认为union
可能适用于此处,以便为内存块分配new
数组int
或其他内容,然后将其作为大bitset
进行操作}。根据这里所说的内容,似乎可以对整个集合进行操作:http://www.cplusplus.com/reference/bitset/bitset/operators/。
答案 0 :(得分:6)
一般来说,没有比for循环更快的神奇方法。但是,您可以通过记住以下几点来简化编译器优化循环:
C99带有常量字节的xoring存储器示例,假设long long为128位,缓冲区的开始对齐为16个字节,而不考虑第3点。两个内存缓冲区上的按位运算非常相似。
size_t len = ...;
char *buffer = ...;
size_t const loadd_per_i = 4
size_t iters = len / sizeof(long long) / loads_per_i;
long long *ptr = (long long *) buffer;
long long xorvalue = 0x5e5e5e5e5e5e5e5e5e5e5e5e5e5e5e5eLL;
// run in multiple threads if there are more than 4 MB to xor
#pragma omp parallel for if(iters > 65536)
for (size_t i = 0; i < iters; ++i) {
size_t j = loads_per_i*i;
ptr[j ] ^= xorvalue;
ptr[j+1] ^= xorvalue;
ptr[j+2] ^= xorvalue;
ptr[j+3] ^= xorvalue;
}
// finish long longs which don't align to 4
for (size_t i = iters * loads_per_i; i < len / sizeof(long long); ++i) {
ptr[i] ^= xorvalue;
}
// finish bytes which don't align to long
for (size_t i = (len / sizeof(long long)) * sizeof(long long); i < len; ++i) {
buffer[i] ^= xorvalue;
}