使用Open Images数据集重新训练im2txt模型

时间:2016-11-10 15:57:59

标签: tensorflow

我有一个训练有素的 im2txt 模型(https://github.com/tensorflow/models/tree/master/im2txt)。我使用MSCOCO imageset进行培训,因为它是在文档中写的。

我想继续使用Google Open Images Dataset进行培训。

我想知道是否有可能重新培训im2txt模型以及我需要做些什么来准备培训的新数据集。 Google数据集和MSCOCO数据集似乎有不同的格式。

我会感激任何帮助。

1 个答案:

答案 0 :(得分:4)

尽管可能重新训练模型,但请记住这两个数据集具有不同的标签语义和约定,因此要理解结果可能不是100%可比较的。

您需要使用类似于COCO script的脚本预处理数据。

在openimages发行版中提供了script推理,但它确实包含解包数据的代码。

最后,如果您完成此操作,我们会始终在我们的github models页面上以拉取请求的形式向您提供捐款。