我是caffe的新手,我试图将张量流模型转换为caffe。 我有一个元组,它的形状有点复杂,因为它存储了一些单词向量。 这是元组数据的形状 -
data[0]: a list, [684, 84], stores the sentence vector;
data[1]: a list, [684, 84], stores the position vector;
data[2]: a matrix, [684, 10], stores the aspects of the sentence;
data[3]: a matrix, [1, 684], stores the label of each sentence;
data[4]: a number, stores the max length of sentences;
每行代表一个句子,也是数据集的样本。
在tf中,我从一个由我自己写的函数中返回整个元组。
train_data = read_data(FLAGS.train_data, source_count, source_word2idx)
我注意到caffe在训练数据之前总是需要一个数据层,但是我没有想法如何将我的数据转换为lmdb类型,或者只是将它们作为元组或矩阵发送到模型中。
顺便说一下,我正在使用pycaffe。
安理会有人帮忙吗?
非常感谢!
答案 0 :(得分:1)
没有特别的魔力;您需要做的就是编写一个读取文件的输入例程,并以train_data
期望的格式返回数据。您无需将数据预转换为LMDB或任何其他格式;只需编写read
数据即可接受当前的输入格式,并为模型提供所需的格式。
我们无法从那里为您提供帮助:您根本没有指定模型的格式,并且您只为我们提供了输入数据的形状(没有内部结构)或语义)。简单地将数据视为您正在计算如何组织给定输出格式的输入数据。