具有64GB RAM和16个逻辑内核的m4.4xlarge EC2计算机与具有4个逻辑内核的16GB RAM笔记本电脑的结果几乎相同? 我使用基准测试包进行测试(附在下面)。 有没有办法更好地配置m4.4xlarge EC2计算机? 这是m4.4xlarge EC2计算机的系统信息
Sys.info()
sysname release version
"Windows" "Server >= 2012 x64" "build 9200"
nodename machine login
"EC2AMAZ-4R7L3U6" "x86-64" "Administrator"
user effective_user
"Administrator" "Administrator"
> library("parallel", lib.loc="C:/Program Files/R/R-3.4.2/library")
> detectCores(logical = FALSE)
[1] 8
> detectCores(logical = TRUE)
[1] 16
这是我的笔记本电脑的系统信息:
Sys.info()
sysname release version
"Windows" "7 x64" "build 7601, Service Pack 1"
nodename machine login
"USER-PC" "x86-64" "user"
user effective_user
"user" "user"
> detectCores(logical = TRUE)
[1] 4
> detectCores(logical = FALSE)
[1] 2
测试结果如下: 对于m4.4xlarge EC2计算机:
> benchmark_std()
user system elapsed test test_group cores
1 1.02 0.02 1.03 fib prog 0
2 0.75 0.00 0.75 fib prog 0
3 0.77 0.00 0.77 fib prog 0
4 1.34 0.07 1.41 gcd prog 0
5 1.20 0.06 1.27 gcd prog 0
6 1.05 0.08 1.12 gcd prog 0
7 0.19 0.02 0.21 hilbert prog 0
8 0.34 0.02 0.36 hilbert prog 0
9 0.35 0.02 0.36 hilbert prog 0
10 16.37 0.03 16.40 toeplitz prog 0
11 16.46 0.00 16.46 toeplitz prog 0
12 16.37 0.00 16.37 toeplitz prog 0
13 1.41 0.04 1.44 escoufier prog 0
14 1.25 0.00 1.25 escoufier prog 0
15 1.27 0.00 1.27 escoufier prog 0
16 0.91 0.01 0.92 manip matrix_cal 0
17 0.92 0.02 0.94 manip matrix_cal 0
18 0.78 0.00 0.78 manip matrix_cal 0
19 1.01 0.02 1.03 power matrix_cal 0
20 1.03 0.00 1.03 power matrix_cal 0
21 1.03 0.02 1.04 power matrix_cal 0
22 0.82 0.00 0.83 sort matrix_cal 0
23 0.81 0.02 0.83 sort matrix_cal 0
24 0.80 0.03 0.83 sort matrix_cal 0
25 8.83 0.00 8.83 cross_product matrix_cal 0
26 8.83 0.01 8.85 cross_product matrix_cal 0
27 8.85 0.02 8.86 cross_product matrix_cal 0
28 5.92 0.01 5.93 lm matrix_cal 0
29 5.92 0.00 5.92 lm matrix_cal 0
30 5.90 0.02 5.93 lm matrix_cal 0
31 5.17 0.02 5.18 cholesky matrix_fun 0
32 5.03 0.02 5.05 cholesky matrix_fun 0
33 5.03 0.01 5.04 cholesky matrix_fun 0
34 2.89 0.00 2.89 determinant matrix_fun 0
35 2.84 0.00 2.84 determinant matrix_fun 0
36 2.87 0.00 2.87 determinant matrix_fun 0
37 0.73 0.00 0.73 eigen matrix_fun 0
38 0.74 0.00 0.74 eigen matrix_fun 0
39 0.73 0.00 0.74 eigen matrix_fun 0
40 0.28 0.00 0.28 fft matrix_fun 0
41 0.28 0.00 0.29 fft matrix_fun 0
42 0.28 0.00 0.29 fft matrix_fun 0
43 2.14 0.02 2.17 inverse matrix_fun 0
44 2.17 0.00 2.17 inverse matrix_fun 0
45 2.16 0.00 2.16 inverse matrix_fun 0
对于16GB笔记本电脑:
user system elapsed test test_group cores
1 0.67 0.00 0.67 fib prog 0
2 0.69 0.00 0.68 fib prog 0
3 0.67 0.00 0.67 fib prog 0
4 1.20 0.05 1.26 gcd prog 0
5 1.18 0.02 1.20 gcd prog 0
6 1.22 0.01 1.23 gcd prog 0
7 0.52 0.02 0.53 hilbert prog 0
8 0.48 0.05 0.53 hilbert prog 0
9 0.25 0.01 0.27 hilbert prog 0
10 16.08 0.00 16.18 toeplitz prog 0
11 18.87 0.00 18.90 toeplitz prog 0
12 16.81 0.00 16.86 toeplitz prog 0
13 1.17 0.00 1.17 escoufier prog 0
14 1.21 0.00 1.22 escoufier prog 0
15 1.19 0.00 1.21 escoufier prog 0
16 0.95 0.00 0.95 manip matrix_cal 0
17 1.14 0.05 1.19 manip matrix_cal 0
18 0.67 0.03 0.72 manip matrix_cal 0
19 0.86 0.00 0.85 power matrix_cal 0
20 0.89 0.00 0.89 power matrix_cal 0
21 0.87 0.00 0.88 power matrix_cal 0
22 0.75 0.00 0.75 sort matrix_cal 0
23 0.71 0.03 0.75 sort matrix_cal 0
24 0.71 0.00 0.73 sort matrix_cal 0
25 7.99 0.00 8.01 cross_product matrix_cal 0
26 7.96 0.07 8.03 cross_product matrix_cal 0
27 7.96 0.00 7.97 cross_product matrix_cal 0
28 5.38 0.00 5.41 lm matrix_cal 0
29 5.50 0.00 5.49 lm matrix_cal 0
30 5.50 0.00 5.51 lm matrix_cal 0
31 4.55 0.03 4.63 cholesky matrix_fun 0
32 4.68 0.00 4.73 cholesky matrix_fun 0
33 4.54 0.02 4.60 cholesky matrix_fun 0
34 3.06 0.00 3.11 determinant matrix_fun 0
35 3.41 0.00 3.42 determinant matrix_fun 0
36 3.44 0.00 3.46 determinant matrix_fun 0
37 0.98 0.00 0.99 eigen matrix_fun 0
38 0.79 0.00 0.79 eigen matrix_fun 0
39 1.03 0.00 1.06 eigen matrix_fun 0
40 0.40 0.00 0.42 fft matrix_fun 0
41 0.39 0.00 0.39 fft matrix_fun 0
42 0.39 0.00 0.39 fft matrix_fun 0
43 2.75 0.00 2.74 inverse matrix_fun 0
44 2.70 0.00 2.79 inverse matrix_fun 0
45 2.70 0.00 2.69 inverse matrix_fun 0
答案 0 :(得分:4)
您的基准测试似乎是计算不易并行化的数学函数,因此它们很可能不是并行化的。
这意味着只有一个CPU核心可以完成工作。
因此,计算机中的核心数(虚拟或非虚拟)不会影响性能,只会影响核心的速度。 您的笔记本电脑似乎比EC2计算机慢一点,考虑到单个核心的预期速度差异,这似乎是预期的。
然后,由于人们不能只是“加速”EC2计算机(它们已经尽可能快地运行),使用这些基准测试就无法获得更好的结果。尝试另一个执行某些并行处理的基准测试,您将看到EC2实例VS的巨大优势。你的笔记本电脑。