Question

我正在为128位数的长流写一个压缩器。我想将这些数字存储为差异 - 仅存储数字之间的差异而不是数字本身，因为我可以将差异打包在更少的字节中，因为它们更小。

但是，对于压缩，我需要减去这些128位值，对于解压缩，我需要添加这些值。我的编译器的最大整数大小是64位宽。

有人有任何想法有效地做到这一点吗？

Answer 1

如果您只需要加法和减法，并且您已经拥有二进制形式的128位值，那么库可能会很方便，但并非绝对必要。这个数学很容易做到。

我不知道你的编译器对64位类型使用了什么，所以我将使用INT64和UINT64来表示有符号和无符号的64位整数。

class Int128
{
public:
    ...
    Int128 operator+(const Int128 & rhs)
    {
        Int128 sum;
        sum.high = high + rhs.high;
        sum.low = low + rhs.low;
        // check for overflow of low 64 bits, add carry to high
        if (sum.low < low)
            ++sum.high;
        return sum;
    }
    Int128 operator-(const Int128 & rhs)
    {
        Int128 difference;
        difference.high = high - rhs.high;
        difference.low = low - rhs.low;
        // check for underflow of low 64 bits, subtract carry to high
        if (difference.low > low)
            --difference.high;
        return difference;
    }

private:
    INT64  high;
    UINT64 low;
};

Answer 2

看看GMP。

#include <stdio.h>
#include <gmp.h>

int main (int argc, char** argv) {
    mpz_t x, y, z;
    char *xs, *ys, *zs;
    int i;
    int base[4] = {2, 8, 10, 16};

    /* setting the value of x in base 10 */
    mpz_init_set_str(x, "100000000000000000000000000000000", 10);

    /* setting the value of y in base 16 */
    mpz_init_set_str(y, "FF", 16);

    /* just initalizing the result variable */
    mpz_init(z);

    mpz_sub(z, x, y);

    for (i = 0; i < 4; i++) {
        xs = mpz_get_str(NULL, base[i], x);
        ys = mpz_get_str(NULL, base[i], y);
        zs = mpz_get_str(NULL, base[i], z);

        /* print all three in base 10 */
        printf("x = %s\ny = %s\nz = %s\n\n", xs, ys, zs);

        free(xs);
        free(ys);
        free(zs);
    }

    return 0;
}

输出

x = 10011101110001011010110110101000001010110111000010110101100111011111000000100000000000000000000000000000000
y = 11111111
z = 10011101110001011010110110101000001010110111000010110101100111011111000000011111111111111111111111100000001

x = 235613266501267026547370040000000000
y = 377
z = 235613266501267026547370037777777401

x = 100000000000000000000000000000000
y = 255
z = 99999999999999999999999999999745

x = 4ee2d6d415b85acef8100000000
y = ff
z = 4ee2d6d415b85acef80ffffff01

Answer 3

我完全偶然发现了这个相对较老的帖子，我觉得有必要详细说明Volte以前的猜想是为了没有经验的读者的利益。

首先，128位数的符号范围是-2 ¹²⁷到2 ¹²⁷ -1而不是-2 ¹²⁷到2 ¹²⁷按原规定。

其次，由于有限算术的循环性质，两个128位数之间所需的最大差值为-2 ¹²⁷至2 ¹²⁷ -1，其中有一个存储先决条件为128位，而不是129.虽然（2 ¹²⁷ -1） - （-2 ¹²⁷）= 2 ¹²⁸ -1显然大于我们的最大2 ¹²⁷ -1正整数，算术溢出总是确保任何两个 n位数之间的最近距离总是在0到2的范围内ⁿ -1因此暗示-2 ^{n -1}至2 ^{n -1} -1。

为了澄清，让我们首先研究一个假设的3位处理器如何实现二进制加法。例如，请考虑下表，该表描述了3位整数的绝对无符号范围。

0 = 000b
1 = 001b
2 = 010b
3 = 011b
4 = 100b
5 = 101b
6 = 110b
7 = 111b ---＆gt; [溢出时循环回到000b]

从上表可以看出：

001b（1）+ 010b（2）= 011b（3）

同样显而易见的是，将这些数字中的任何一个与其数字补码相加总是产生2 ⁿ -1：

010b（2）+ 101b（[2的补数] = 5）= 111b（7）=（2 ³ -1）

由于在添加两个 n比特数导致（ n +1）比特结果时发生循环溢出，因此遵循添加任何这些带有数字补码+ 1的数字总是会产生0：

010b（2）+ 110b（[2的补充] + 1）= 000b（0）

因此，我们可以说[ n ]的补充+ 1 = - n ，以便 n + [的补充n ] + 1 = n +（ - n ）= 0.此外，如果我们现在知道 n + [补充 n ] + 1 = 0，然后 n + [ n - x ] + 1的补充必须= n - （ n - x ）= x 。

将其应用于我们原来的3位表会产生：

0 = 000b = [0的补码] + 1 = 0
1 = 001b = [7的补数] + 1 = -7
2 = 010b = [6的补数] + 1 = -6
3 = 011b = [5的补数] + 1 = -5
4 = 100b = [4的补数] + 1 = -4
5 = 101b = [3的补数] + 1 = -3
6 = 110b = [2的补数] + 1 = -2
7 = 111b = [1的补数] + 1 = -1 ---＆gt; [溢出时循环回到000b]

代表性抽象是正面，负面还是两者的组合，如带有符号的二进制补码算法所暗示，我们现在有2 ⁿ n -bit模式，可以无缝地提供正0到2 ⁿ -1和负0到 - （2 ^{n < / sup>） - 在需要时有1个范围。事实上，所有现代处理器都采用这样的系统，以便为加法和减法操作实现通用的ALU电路。当CPU遇到i1 - i2减法指令时，它在i2内部执行[complement + 1]操作，然后通过加法电路处理操作数，以便计算i1 + [补码] i2] + 1.除了附加的进位/符号XOR门控溢出标志外，有符号和无符号加法以及暗示减法都是隐含的。}

如果我们将上表应用于输入序列[-2 ^{n -1}，2 ^{n -1} -1，-2 ^{n -1}]如Volte的原始回复中所示，我们现在能够计算以下n位差分：

差异＃1：
（2 ^{n -1} -1） - （-2 ^{n -1}）=
3 - （ - 4）= 3 + 4 =
（-1）= 7 = 111b

差异＃2：
（-2 ^{n -1}） - （2 ^{n -1} -1）=
（-4）-3 =（ - 4）+（5）=
（-7）= 1 = 001b

从我们的种子-2 ^{n -1}开始，我们现在能够通过顺序应用上述每个差异来重现原始输入序列：

（ - 2 ^{n -1}）+（差异＃1）=
（-4）+ 7 = 3 =
2 ^名词的-1 -1

（2 ^{n -1} -1）+（差异＃2）=
3 +（ - 7）=（ - 4）=
-2 ^名词的-1

你当然希望对这个问题采取一种更哲学的方法，并推测为什么2 ⁿ循环序列数要求超过2 ⁿ循环序列差异？

Taliadon。

Answer 4

Boost 1.53现在包括multiprecision：

#include <boost/multiprecision/cpp_int.hpp>
#include <iostream>

// Requires Boost 1.53 or higher
// build: g++ text.cpp

int main()
{
    namespace mp = boost::multiprecision;

    mp::uint128_t a = 4294967296;
    mp::uint256_t b(0);
    mp::uint512_t c(0);

    b = a * a;
    c = b * b;

    std::cout << "c: " << c << "\n";
    return 0;
}

输出：

./a.out
c: 340282366920938463463374607431768211456

Answer 5

关于大整数数学有很多文献。您可以使用其中一个免费提供的库（请参阅链接），也可以自行编辑。虽然我应该警告你，对于比加法和减法（和移位）更复杂的事情，你需要使用非平凡的算法。

要添加和减去，可以创建一个包含两个64位整数的类/结构。您可以使用简单的学校数学来进行加法和减法。基本上，用铅笔和纸做加法或减法，仔细考虑携带/借用。

搜索大整数。顺便说一下最新版本的VC ++，IntelC ++和GCC编译器都有128位整数类型，虽然我不确定它们是否像你想要的那样容易访问（它们可以用于sse2 / xmms寄存器）。

Answer 6

TomsFastMath有点像GMP（如上所述），但它是公共领域，并且从一开始就设计得非常快（它甚至包含x86，x86-64，ARM的汇编代码优化， SSE2，PPC32和AVR32）。

Answer 7

另外值得注意的是：如果目标仅仅是通过预处理来改进数字流的压缩，那么预处理的流不必由精确的算术差异组成。您可以使用XOR（^）代替+和-。优点是128位XOR与64位器件上的两个独立XOR完全相同，因此既简单又高效。

如果我的编译器不支持它们，如何在C或C ++中添加和减去128位整数？

7 个答案: