标签: clang llvm llvm-clang llvm-ir
我们使用clang编译IR代码,然后在某个位置执行IR。
由于某些原因,我们在编译选项中添加了“ -fno-inline”,这会带来非常糟糕的性能。在IR代码花费不到1毫秒之前,打开“ -fno-inline”之后,IR代码花费超过20毫秒。
据我了解,内联仅消除函数调用的成本(例如rbp / rsp push / pop,call / ret)。
我是对的吗?有什么建议吗?