标签: x86 conv-neural-network simd simd-library synet
我使用Synet框架来推断CPU上训练有素的神经网络。该框架支持两种张量格式:NCHW和NHWC。 我尝试同时使用它们,发现第二个要比第一个快得多。 我知道Synet使用Simd Library作为后端来优化推理算法。
所以我有一个问题:Synet和Simd的此功能还是在CPU上NHWC比NCHW快?