C ++模运算符Vs。 Shift运算符,哪个更快,为什么?

时间:2018-09-21 06:09:25

标签: c++ time bit-shift

我正在研究寻找素数的代码,在工作中,我很好奇C ++中的%运算在低级如何工作。

首先,我编写了一些代码来比较'%'运算符和'>>'运算符的运行时间。

#include <iostream>
#include <chrono>
#include <unistd.h>
#include <stdlib.h>
#include <time.h>

using namespace std;

bool remainder1(int x);
bool remainder2(int y);
void timeCompare(bool(*f)(int), bool(*g)(int));

// I want to check which one is faster, x % 2 Vs. (x >> 1) & 1
int main()
{
    srand(time(NULL));

    for (int i = 0; i < 10; i++) {
        timeCompare(remainder1, remainder2);
    }

    return 0;
}

// % 2 operation
bool remainder1(int x) {

    if (x % 128) return true;
    else return false;
}

bool remainder2(int x) {

    if ((x >> 7) & 1) return true;
    else return false;
}

void timeCompare(bool(*f)(int), bool(*g)(int)) {

    srand(time(NULL));

    auto start = chrono::steady_clock::now();

    for (int i = 0; i < 10000000; i++) {
        int x = rand();
        f(x);
    }

    auto end = chrono::steady_clock::now();

    cout << "Elapsed time in nanoseconds : "
         << chrono::duration_cast<chrono::nanoseconds>(end - start).count()
         << " ns";


    auto start2 = chrono::steady_clock::now();

    for (int i = 0; i < 10000000; i++) {
        int x = rand();
        g(x);
    }

    auto end2 = chrono::steady_clock::now();


    cout << " Vs. "
         << chrono::duration_cast<chrono::nanoseconds>(end2 - start2).count()
         << " ns" << endl;


}

输出为:

Elapsed time in nanoseconds : 166158000 ns Vs. 218736000 ns
Elapsed time in nanoseconds : 151776000 ns Vs. 214823000 ns
Elapsed time in nanoseconds : 162193000 ns Vs. 217248000 ns
Elapsed time in nanoseconds : 151338000 ns Vs. 211793000 ns
Elapsed time in nanoseconds : 150346000 ns Vs. 211295000 ns
Elapsed time in nanoseconds : 155799000 ns Vs. 215265000 ns
Elapsed time in nanoseconds : 148801000 ns Vs. 212839000 ns
Elapsed time in nanoseconds : 149813000 ns Vs. 226175000 ns
Elapsed time in nanoseconds : 152324000 ns Vs. 213338000 ns
Elapsed time in nanoseconds : 149353000 ns Vs. 216809000 ns 

因此,移位操作似乎很难找到余数。我猜想原因是shift版本比“%”版本需要更多的比较...我正确吗?

我真的很想知道'%'在较低级别的工作原理!

1 个答案:

答案 0 :(得分:4)

  

我真的很想知道'%'在较低级别的工作原理!

如果您问它是如何实现的,那么答案是您正在使用的CPU具有单个指令进行模运算({{1 }。例如,使用以下C ++代码:

%

为其生成的 x86 汇编代码为:

int main()
{
    int x = 100;

    int mod = x % 128;
    int shift = x >> 7;

    return 0;
}

idiv instruction被称为 Signed Divide ,它把商数放在EAX / RAX中,而余数放在EDX / RDX中,分别表示(x86 / x64)。

  

我猜测原因是轮班版本需要再进行一次比较   而不是'%'版本...对吗?

在这种情况下,由于它是一条指令,因此不进行比较。