目前,在Caffe中开发了许多深度学习模型而不是张量流。如果我想在tensorflow中重写这些模型,如何开始?我不熟悉Caffe结构。在我看来,有一些文件只存储模型架构。我的猜测是我只需要了解并将这些架构设计转移到Tensorflow中。无论如何,输入/输出/培训将被重写。这个想法有意义吗?
我看到一些Caffe实现还需要攻击原始的Caffe框架,直到C ++级别,并进行一些修改。我不确定Caffe模型开发人员在什么样的情况下需要深入了解?如果我只是想在Tensorflow中重新实现他们的模型,我是否需要去检查他们的C ++修改,有时根本没有记录。
我知道有一些Caffe-Tensorflow转换工具。但总有一些限制,我认为直接重写模型可能更直接。
非常感谢任何建议,建议和教程链接。
答案 0 :(得分:3)
我已经问过a similar question了。
合成可能的答案:
您可以使用预先存在的工具,例如etheron's kaffe(这非常简单易用)。但它的简单性是有代价的:它不容易调试。
正如@Yaroslav Bulatov从头开始回答并试图让每一层都匹配。在这方面,我建议你看看ry's github,这是一个非常好的例子,你基本上有一些辅助函数,它们表明如何从caffe到Tensorflow适当地重塑权重,这是你唯一需要做的事情。使简单模型匹配,并逐层提供激活检查。