如何从C读取火炬张量

时间:2015-05-05 14:43:03

标签: c lua neural-network luajit torch

我必须使用Torch框架训练卷积神经网络,然后在C中编写相同的网络。 为此,我必须以某种方式从我的C程序中读取网络的学习参数,但我无法找到一种方法来转换或写入Torch Tensors的文件,使其在C中可读。 理想情况下,我想将Tensors转换为C中的double数组。

有谁知道怎么做?在此先感谢:)

1 个答案:

答案 0 :(得分:5)

  

我无法找到一种方法来转换或写入Torch Tensors的文件,使其在C中可读。理想情况下,我想将Tensors转换为C中的double数组。

最基本(也是直接)的方法是在C中直接fread将先前写入二进制文件的数据。在这种情况下,您通常会连接每个图层的权重和偏差(如果有的话)。

在Lua / Torch端,您可以使用File实用程序逐字fwrite每个张量数据。例如,这是一个基本功能:

local fwrite = function(tensor, file)
  if not tensor then return false end
  local n = tensor:nElement()
  local s = tensor:storage()
  return assert(file:writeDouble(s) == n)
end

例如,如果m引用包含权重的torch/nn模块,您可以按如下方式使用它:

local file = torch.DiskFile("net.bin", "w"):binary()
fwrite(m.weight, file)
fwrite(m.bias, file)

当然,您需要编写自己的逻辑以确保fwrite并连接所有图层的所有权重。在C方面,除了net.bin之外,您还需要了解网络的结构(nb。层,参数,如内核大小等),以了解double - s的块数。 fread

作为示例(在Lua中),您可以查看overfeat-torch(非官方项目),其中说明了如何阅读这样的纯二进制文件:请参阅ParamBank工具。

请记住,强大的解决方案包括使用适当的二进制序列化格式,如msgpackProtocol Buffers,这样可以使此导出/导入过程保持干净和便携。

-

这是一个玩具示例:

-- EXPORT
require 'nn'

local fwrite = function(tensor, file)
  if not tensor then return false end
  local n = tensor:nElement()
  local s = tensor:storage()
  return assert(file:writeDouble(s) == n)
end

local m = nn.Linear(2, 2)

print(m.weight)
print(m.bias)

local file = torch.DiskFile("net.bin", "w"):binary()
fwrite(m.weight, file)
fwrite(m.bias, file)

然后在C:

/* IMPORT */
#include <stdio.h>
#include <stdlib.h>
#include <assert.h>

int
main(void)
{
  const int N = 2; /* nb. neurons */

  double *w = malloc(N*N*sizeof(*w)); /* weights */
  double *b = malloc(N*sizeof(*w));   /* biases */

  FILE *f = fopen("net.bin", "rb");
  assert(fread(w, sizeof(*w), N*N, f) == N*N);
  assert(fread(b, sizeof(*w), N, f) == N);
  fclose(f);

  int i, j;
  for (i = 0; i < N; i++)
    for (j = 0; j < N; j++)
      printf("w[%d,%d] = %f\n", i, j, w[N*i+j]);

  for (i = 0; i < N; i++)
      printf("b[%d] = %f\n", i, b[i]);

  free(w);
  free(b);

  return 0;
}