标签: performance optimization matrix
如果将两个矩阵A*B = C相乘,则它们中的任何一个都可以具有可忽略不计的大量值,即接近零。零实际上没有任何块结构。
A*B = C
我有什么解决方案来减少操作? 我想主要是试图置换矩阵以进入块零结构,但这本身可能是O(3)成本。 CRS或CCS似乎没有很多现成的dgemm等价物。
O(3)