标签: performance assembly generator auto
我正在尝试为数学库的一个操作编写一个汇编指令生成器。为了实现高性能,需要用汇编语言编写一些操作,并且矢量化也是必需的。最终目标是实现一个跨平台生成器,以自动生成高性能的装配体实现,从而节省时间。现在,计算操作的抽象是手动的,我想知道是否还有一些更自动的方法来抽象该操作。也许某些前端编译技术会适用?