如何从ifstream加载LLVM bitcode文件?

时间:2014-03-07 01:37:49

标签: c++ llvm iostream

我正在尝试在运行时加载.bc文件中定义的LLVM模块,但遇到了麻烦。

感兴趣的bitcode来自hello.cpp

// hello.cpp
// build with:
// clang-3.4 -c -emit-llvm hello.cpp -o hello.bc
#include <iostream>

void hello()
{
  std::cout << "Hello, world!" << std::endl;
}

当下面的程序试图在运行时加载它时,它会在llvm::BitstreamCursor::Read()

内崩溃
// main.cpp
// build with:
// g++ main.cpp `llvm-config-3.4 --cppflags --ldflags --libs` -ldl -lpthread -lcurses
#include <llvm/IR/Module.h>
#include <llvm/IRReader/IRReader.h>
#include <llvm/IR/LLVMContext.h>
#include <llvm/Support/SourceMgr.h>
#include <llvm/Support/MemoryBuffer.h>
#include <llvm/Support/raw_ostream.h>
#include <fstream>
#include <iostream>

llvm::Module *load_module(std::ifstream &stream)
{
  if(!stream)
  {
    std::cerr << "error after open stream" << std::endl;
    return 0;
  }

  // load bitcode
  std::string ir((std::istreambuf_iterator<char>(stream)), (std::istreambuf_iterator<char>()));

  // parse it
  using namespace llvm;
  LLVMContext context;
  SMDiagnostic error;
  Module *module = ParseIR(MemoryBuffer::getMemBuffer(StringRef(ir.c_str())), error, context);

  if(!module)
  {
    std::string what;
    llvm::raw_string_ostream os(what);
    error.print("error after ParseIR()", os);
    std::cerr << what;
  } // end if

  return module;
}

int main()
{
  std::ifstream stream("hello.bc", std::ios_base::binary);
  llvm::Module *m = load_module(stream);
  if(m)
  {
    m->dump();
  }

  return 0;
}

我正在使用评论中提到的命令行来构建LLVM v3.4。

知道我做错了吗?

2 个答案:

答案 0 :(得分:4)

一种可能的解决方案是用

替换ParseIR()来电

ParseIRFile("hello.bc", error, getGlobalContext())

这样做也使代码更加简单,因为您可以跳过尝试手动加载bitcode的部分。

以下内容足以获取模块的转储(您应该为其添加一些错误处理)

#include <llvm/IR/Module.h>
#include <llvm/IRReader/IRReader.h>
#include <llvm/IR/LLVMContext.h>
#include <llvm/Support/SourceMgr.h>

using namespace llvm;
int main()
{
  LLVMContext context;
  SMDiagnostic error;
  Module *m = ParseIRFile("hello.bc", error, context);
  if(m)
  {
    m->dump();
  } 

  return 0;
}

答案 1 :(得分:4)

有两个问题:

  1. LLVMContext的生命周期需要比Module的生命周期更长。否则,Module将引用不再存在的LLVMContext
  2. 引用IR的StringRef应该从包含IR的std::string构建,而不是以零终止的字符串构建。否则ParseIR无法正确找到IR的结尾。
  3. 以下是load_module的更正版本:

    llvm::Module *load_module(std::ifstream &stream, llvm::LLVMContext &context)
    {
      if(!stream)
      {
        std::cerr << "error after open stream" << std::endl;
        return 0;
      }
    
      // load bitcode
      std::string ir((std::istreambuf_iterator<char>(stream)), (std::istreambuf_iterator<char>()));
    
      // parse it
      using namespace llvm;
      SMDiagnostic error;
      Module *module = ParseIR(MemoryBuffer::getMemBuffer(StringRef(ir)), error, context);
    
      if(!module)
      {
        std::string what;
        llvm::raw_string_ostream os(what);
        error.print("error after ParseIR()", os);
        std::cerr << what;
      } // end if
    
      return module;
    }