我指的是这个问题和最高投票答案: -
Why are elementwise additions much faster in separate loops than in a combined loop?
我的问题是,是否有一种简单的方法可以确定特定cpu用于加载/存储的地址别名的位数(称为N)?
答案 0 :(得分:0)
在操作系统级别:没有。我不知道任何标准的OS API(包括Linux或Win32中的任何内容)可以让您对CPU缓存有任何用户空间可见性。
但是,英特尔提供了一些伟大的工具,用于低级性能分析和优化。例如,