TL,DR:即使-O3处于活动状态,如何强制clang导出隐式实例化函数的符号?
让我们采用以下代码:
#include <iostream>
#include <llvm/Support/DynamicLibrary.h>
#include <llvm/ExecutionEngine/ExecutionEngine.h>
#include <llvm/ExecutionEngine/RTDyldMemoryManager.h>
template <typename T>
__attribute__((noinline))
int twice(const T& t) {
return t * 2;
}
int thrice(const int& t) {
return t * 3;
}
int main() {
std::cout << twice(5) << std::endl;
std::cout << thrice(5) << std::endl;
llvm::sys::DynamicLibrary::LoadLibraryPermanently(nullptr); // Make symbols from current process visible
std::cout << "address of twice: " << llvm::RTDyldMemoryManager::getSymbolAddressInProcess("__Z5twiceIiEiRKT_") << std::endl;
std::cout << "address of thrice: " << llvm::RTDyldMemoryManager::getSymbolAddressInProcess("__Z6thriceRKi") << std::endl;
}
有两个功能,两次和三次。第一个是模板化的,第二个则不是。我首先定期给他们打电话,然后尝试使用libLLVM获取他们的地址。可以将它视为超级简化的JIT编译器的一部分(该编译器带有随名字而来的mangler)。
使用clang++ -O0 -I/usr/local/opt/llvm/include -L/usr/local/opt/llvm/lib/ jit.cpp -lLLVM
(OS X上的版本6.0.0),输出符合预期:
10
15
address of twice: 4350763184
address of thrice: 4350762224
如果启用优化功能,twice
的符号将不再导出,如nm a.out | grep twice
所示:
00000001000010b0 T __Z5twiceIiEiRKT_ (with -O0)
00000001000009c0 t __Z5twiceIiEiRKT_ (with -O3)
结果是,libLLVM不再找到该功能:
10
15
address of twice: 0
address of thrice: 4315621072
使用gcc可以导出符号。
如果我显式实例化它,我可以用clang导出该符号:
template int twice<int>(const int& t);
但是,这并不是真正的选择,因为我们不知道JIT引擎将调用哪些实例化。
我知道this post,但它只处理显式实例化。
答案 0 :(得分:1)
添加属性used
,如下所示:
template <typename T>
__attribute__((used))
int twice(const T& t) {
return t * 2;
}
这将迫使Clang导出符号。