这可能是一个非常常见且简单的问题,但我需要对我刚刚从缓存基准测试代码中获得的曲线进行一些解释。这里的目标是找到缓存行大小。我用过这里的代码: (H ** PS://github.com/jiewmeng/cs3210-assign1/blob/master/cache-l1-line.cpp)
这是我在我的机器上运行代码所获得的曲线(带有核心i7的Macbook Pro - 缓存行大小为64byte - L1数据缓存为32KB)。
The Time vs different stride size curve
更新
我还运行了一个代码来确定L1和L2缓存的大小。这是仅用于记录数据的图。如您所见,32KB(L1高速缓存大小)和256KB(L2高速缓存大小)有两个峰值。
问题:
我想知道是否有办法找到L3共享缓存的大小。
由于
答案 0 :(得分:1)
我猜测128B峰值很可能是由于空间预取。您可以在Intels'Optimization guide中的2.1.5.4节中看到
此预取程序努力完成提取到L2缓存的每个缓存行,并使用完成它的对线到128字节对齐的块
这不是一个干净的跳跃,因为这个预取并不总是触发,即使它确实,它只预取到L2,但它比从内存中取出要好得多。为了确保这种情况,你可以禁用预取(通过BIOS或其他方式,虽然有些系统可能不支持),然后再次检查。
至于L3大小 - 你没有指定你的确切模型,但我猜你有超过4M的L3 - 只需保持曲线,看它是否会跳跃。
修改强>
注意到另一件事 - 你的k * i表达式可能在最大范围内溢出int,这意味着你的访问模式可能不像你期望的那样是循环的。
答案 1 :(得分:1)
我的BusSpeed基准测试用于在不同的步幅中识别高速缓存大小和性能,以显示总线上的突发读取:
http://www.roylongbottom.org.uk/busspd2k%20results.htm
以下是具有8 MB L3的Core i7的结果:
Memory Reg2 Reg2 Reg2 Reg2 Reg1 Reg2 Reg1 Reg2 Reg1 Reg8
KBytes Inc64 Inc32 Inc16 Inc8 Inc4 Inc4 Inc4 Inc4 Inc8 Inc8
Used MB/S MB/S MB/S MB/S MB/S MB/S MB/S MB/S MB/S MB/S
4 10025 10800 11262 11498 11612 11634 5850 11635 23093 23090
8 10807 11267 11505 11627 11694 11694 5871 11694 23299 23297
16 11251 11488 11620 11614 11712 11719 5873 11718 23391 23398
32 9893 9853 10890 11170 11558 11492 5872 11466 21032 21025
64 3219 4620 7289 9479 10805 10805 5875 10797 14426 14426
128 3213 4805 7305 9467 10811 10810 5875 10805 14442 14408
256 3144 4592 7231 9445 10759 10733 5870 10743 14336 14337
512 2005 3497 5980 9056 10466 10467 5871 10441 13906 13905
1024 2003 3482 5974 9017 10468 10466 5874 10467 13896 13818
2048 2004 3497 5958 9088 10447 10448 5870 10447 13857 13857
4096 1963 3398 5778 8870 10328 10328 5851 10328 13591 13630
8192 1729 3045 5322 8270 9977 9963 5728 9965 12923 12892
16384 692 1402 2495 4593 7811 7782 5406 7848 8335 8337
32768 695 1406 2492 4584 7820 7826 5401 7792 8317 8322
65536 695 1414 2488 4584 7823 7826 5403 7800 8321 8321
131072 696 1402 2491 4575 7827 7824 5411 7846 8322 8323
262144 696 1413 2498 4594 7791 7826 5409 7829 8333 8334
524288 693 1416 2498 4595 7841 7842 5411 7847 8319 8285
1048576 704 1415 2478 4591 7845 7840 5410 7853 8290 8283
End of test Fri Jul 30 16:44:29 2010
CPUID and RDTSC Assembly Code
CPU GenuineIntel, Features Code BFEBFBFF, Model Code 000106A5
Intel(R) Core(TM) i7 CPU 930 @ 2.80GHz Measured 2807 MHz