我有一些工作负载的AVX2实现。
我已经确定绝大部分执行时间都被占用了 通过内存加载和存储。
为了提高性能,我试图改变传统商店 流媒体(非时间)商店。
但是,这种变化几乎没有产生积极的性能影响(我预计会有相当大的性能提升)。
这可能是什么原因?
答案 0 :(得分:1)
在某些情况下,使用流媒体商店可以带来更好的表现:
所以你必须考虑你的代码和问题,在这些情况下要知道流媒体商店是否值得一试。在不合适的情况下,您的表现甚至会下降。
可以找到包含其他信息和基准的博客条目,例如here