标签: caching cpu-architecture
我有这个问题: 一个程序,用于计算32位整数(按行)的128x128矩阵之和。我有一个单向高速缓存,它具有8组,块大小为64字节,仅考虑对矩阵的访问而不是对指令的访问。 我应该计算它的未命中率。 以及通过逐列读取矩阵的未命中率。抱歉,如果有语法错误,我只会将其翻译成英文。
到目前为止,我所做的就是(如果我错了,请纠正我):