我使用 Clang作为库来生成一些LLVM IR模块。
以下是该模块的源代码:
inline int getSevenInline() {
return 7;
}
int getSeven() {
return getSevenInline();
}
我希望LLVM IR模块包含一个返回getSeven
的函数7
。
以下是我的程序生成的LLVM IR:
; ModuleID = './test.cpp'
source_filename = "./test.cpp"
target datalayout = "e-m:o-i64:64-f80:128-n8:16:32:64-S128"
target triple = "x86_64-apple-macosx10.12.0"
; Function Attrs: noinline ssp uwtable
define i32 @_Z8getSevenv() #0 {
entry:
%call = call i32 @_Z14getSevenInlinev()
ret i32 %call
}
declare i32 @_Z14getSevenInlinev() #1
attributes #0 = { noinline ssp uwtable "correctly-rounded-divide-sqrt-fp-math"="false" "disable-tail-calls"="false" "less-precise-fpmad"="false" "no-frame-pointer-elim"="true" "no-frame-pointer-elim-non-leaf" "no-infs-fp-math"="false" "no-jump-tables"="false" "no-nans-fp-math"="false" "no-signed-zeros-fp-math"="false" "no-trapping-math"="false" "stack-protector-buffer-size"="8" "target-cpu"="penryn" "target-features"="+cx16,+fxsr,+mmx,+sse,+sse2,+sse3,+sse4.1,+ssse3,+x87" "unsafe-fp-math"="false" "use-soft-float"="false" }
attributes #1 = { "correctly-rounded-divide-sqrt-fp-math"="false" "disable-tail-calls"="false" "less-precise-fpmad"="false" "no-frame-pointer-elim"="true" "no-frame-pointer-elim-non-leaf" "no-infs-fp-math"="false" "no-nans-fp-math"="false" "no-signed-zeros-fp-math"="false" "no-trapping-math"="false" "stack-protector-buffer-size"="8" "target-cpu"="penryn" "target-features"="+cx16,+fxsr,+mmx,+sse,+sse2,+sse3,+sse4.1,+ssse3,+x87" "unsafe-fp-math"="false" "use-soft-float"="false" }
当我尝试执行模块时,它无法解析getSevenInline
的符号。
IR似乎有两种错误:
getSevenInline
不应该存在,因为它应该是内联的getSevenInline
没有实现我应该在clang::CompilerInstance
上配置什么才能正确编译inline
个功能?
我只遇到inline
功能问题;非inline
函数可以正常工作。
不幸的是,我有太多的代码要发布生成IR的整个程序,但我希望有人能指出我在Clang源代码中的配置。
答案 0 :(得分:1)
C ++规范为编译器提供了宽泛的自由度来决定何时或何时不内联函数。即使您明确地将函数声明为内联函数,就编译器而言,它仍然只是一个建议,并且如果它决定生成的机器代码会过于膨胀,它可以自由地忽略该建议。效率低下。它还在很大程度上取决于您传递给编译器的优化标志以及许多其他依赖于实现的细节,这些细节完全由编译器实现者自行决定。
C++ FAQ有关于该主题的更多详细信息:
有几种方法可以指定函数是内联的,其中一些涉及内联关键字,另一些则不涉及。无论您如何将函数指定为内联,都是允许编译器忽略的请求:编译器可能内联展开您调用指定为内联函数的部分,全部或全部位置。 (如果这看起来毫无希望地模糊,请不要气馁。上述的灵活性实际上是一个巨大的优势:它允许编译器对待大型函数与小函数不同,而且它允许编译器生成易于调试的代码,如果您选择正确的编译器选项。)
inline
关键字 做的事情是保证您不会为具有相同名称的函数获取多个定义错误。例如,如果您有(在myinlines.h
中):
inline int add(int a, int b)
{
return a + b;
}
并且您myinlines.h
和file1.cpp
中包含file2.cpp
,当您尝试将file1.o
和file2.o
链接在一起时,您不会遇到链接器错误最终的可执行文件,即使它们都包含int add(int, int)
的定义。 CPPReference有更多详情:
只要每个定义出现在不同的翻译单元中(并且对于非静态内联函数),所有定义都是相同的,程序中的内联函数可能有多个定义。例如,可以在多个源文件中#include&#d; d的头文件中定义内联函数。
答案 1 :(得分:1)
我设法让这个工作,但我不会假装我完全知道为什么它的工作原理:
for (auto declGroup : declGroups) {
codeGenerator->HandleTopLevelDecl(declGroup);
}
// For some reason this triggers the code generation for inline functions
codeGenerator->HandleTranslationUnit(compilerInstance.getASTContext());
我认为是关于延迟的decls; HandleTranslationUnit
告诉CodeGenerator
它应该完成编译。