首先让我解释一下我要概述的问题的动机。我有一个无符号词向量v
,其信息存储在位中,另外还有一个w
类型的单词可能具有不同的无符号类型。我想将len
中的v
位放入w
中,从i
的第w
个LSB开始。例如,考虑以下情况,为了说明起见,我将单词表示为位。
T1 w = 10110100;
vector<T2> v = [11, 00, 10, 01];
T1 len = 5;
T1 start = 2;
T1 dst_digits = 8;
T1 src_digits = 2;
10110100 -> 10111100 -> 10001100 -> 11001100
很明显,我们将需要遍历v
并一次将一个位添加到w
中。一种做到这一点的方法是以下
template<class T>
T _blend(T a, T b, T start, T len) {
// Replaces len bits of a by the ones of b starting at start
}
auto it = std::begin(v);
while (len > 0) {
w = _blend(w,
(T1) ((T1) *first) << start),
start,
std::min(len, src_digits)
);
start += std::min(len, src_digits);
++first;
len -= std::min(len, src_digits);
}
我对C ++相当陌生,上面的代码是简化代码,但主要思想仍然存在。我目前也正在工作。但是,我发现(T1) ((T1) *first) << start)
很丑。但是,如果我不包括第一个转换,则移位操作将提升为int
或long
,然后与其他类型的_blend
不匹配。如果我不包括第二个演员表,我可以overshift *first
(在dst_digits > src_digits
和start > src_digits
的情况下)。
现在,我的问题是两次(T1)
转换的费用是多少?我的猜测并不像其他事情那样昂贵,例如std::min
调用或循环中的其他语句。我之所以这么问只是因为来自Python,看到类似(T1) ((T1) *first) << start)
的东西看起来很自然,我想知道这是否只是C ++的结果而几乎没有开销,以及是否有更好的方法去做。
答案 0 :(得分:1)
在Little-endian系统上,无符号整数到无符号整数的转换将转换为零或一个指令。
如果uint64
中有rax
,则强制转换为uint32
基本上是无操作。编译器将只假定该值位于eax
(rax
的最低有效位)中。
如果uint32
中有eax
,则强制转换为uint64
只是一条非常快的指令。编译器将对eax
中的值进行零扩展(用零填充最高有效部分),然后使用rbx
指令将结果放入movzx
中。
在此操作期间,无符号整数强制转换是您最不用担心的。您可能要考虑使用std::vector<bool>
或std::bitset
,因为它们会帮您摆弄一下。