如何使用Session :: Run(TensorFlow C ++ API)以批处理模式执行基于CNN的样本分类

时间:2017-11-20 12:09:35

标签: c++ tensorflow deep-learning

我想在批处理模式下使用C ++中预训练的CNN对多个样本进行分类。到目前为止:

  • 我在Python中使用Keras训练了一个CNN模型,并使用is repo(https://github.com/amir-abdi/keras_to_tensorflow)提供的小脚本转换了这个模型。

  • 我可以使用ReadBinaryProto函数加载模型并创建一个Session对象。

现在我想对n输入张量进行分类。以下代码可以工作,但速度很慢,因为一次运行(~20毫秒)非常快,但必须执行大约20.000次。

std::vector<tensorflow::Tensor> outputs;
std::vector<tensorflow::Tensor> tensor(tensorflow::DT_FLOAT,
     tensorflow::TensorShape({1, winSize, winSize, nochannels }));;
for (unsigned int n = 0; n < noSamples; n++)
{
    copyDataToTensor(prevImg, prevPoints[n], input_tensor, 0);
    tensorflow::Status run_status = m_Session->Run({ { "conv2d_5_input", tensor} }, { "output_node0" }, {}, &outputs);
    ... evaluate outputs ...
}

winSizenoChannels是与CNN输入形状相关的常量。

我正在寻找的是一种以批处理模式运行多个样本的方法,如:

 std::vector<tensorflow::Tensor> outputs;
 std::vector<tensorflow::Tensor> tensor(tensorflow::DT_FLOAT, 
      tensorflow::TensorShape({noSamples, winSize, winSize, nochannels }));;
 for (unsigned int n = 0; n < noSamples; n++)
 {
    copyDataToTensor(prevImg, prevPoints[n], input_tensor, n);
 }
 tensorflow::Status run_status = m_Session->Run({ { "conv2d_5_input", tensor} }, { "output_node0" }, {}, &outputs);
 ... evaluate outputs ...

但是,这种方法不起作用,因为outputs只有一个元素,而此张量的内容只存储一个分类结果的结果。

提供output_tensor_names noSamples{"ouput_node0"}outputs个向量的效果不佳。然后call start cmd.exe /k PATH_TO_NODE_JS PATH_TO_APPIUM_JS --address IP_ADDRESS --port PORT_NUMBER 张量向量具有正确的大小,但每个张量相似。

如何正确使用此功能以批处理模式执行预测?我必须使用另一个接口来解决这个问题吗?

1 个答案:

答案 0 :(得分:1)

它认为第二批模式的奇怪行为的原因是使用此回购(https://github.com/amir-abdi/keras_to_tensorflow)的Keras to Python tranfor脚本中的错误。

导致错误结果的小错误,因为它以错误的方式连接输出而不是fat_2 / Softmax节点。有缺陷的代码是:

K.set_learning_phase(0) net_model = load_model(weight_file_path)

pred = [None]*num_output
pred_node_names = [None]*num_output
for i in range(num_output):
     pred_node_names[i] = prefix_output_node_names_of_final_network+str(i)
     pred[i] = tf.identity(net_model.output[i], name=pred_node_names[i]),
print('output nodes names are: ', pred_node_names)
sess = K.get_session()
constant_graph = graph_util.convert_variables_to_constants(sess, sess.graph.as_graph_def(), pred_node_names)
graph_io.write_graph(constant_graph, output_fld, output_graph_name, as_text=False)

它认为net_model.output [i]中存在一个小错字。如果改为使用输出字段(net_model.outputs [i]),那么每个思维工作正常。 I. e。修复将是:

K.set_learning_phase(0)
net_model = load_model(weight_file_path)

pred = [None]*num_output
pred_node_names = [None]*num_output
for i in range(num_output):
     pred_node_names[i] = prefix_output_node_names_of_final_network+str(i)
     pred[i] = tf.identity(net_model.outputs[i], name=pred_node_names[i]),
print('output nodes names are: ', pred_node_names)
sess = K.get_session()
constant_graph = graph_util.convert_variables_to_constants(sess, sess.graph.as_graph_def(), pred_node_names)
graph_io.write_graph(constant_graph, output_fld, output_graph_name, as_text=False)