我有一个训练有素的 im2txt 模型(https://github.com/tensorflow/models/tree/master/im2txt)。我使用MSCOCO imageset进行培训,因为它是在文档中写的。
我想继续使用Google Open Images Dataset进行培训。
我想知道是否有可能重新培训im2txt模型以及我需要做些什么来准备培训的新数据集。 Google数据集和MSCOCO数据集似乎有不同的格式。
我会感激任何帮助。
答案 0 :(得分:4)
尽管可能重新训练模型,但请记住这两个数据集具有不同的标签语义和约定,因此要理解结果可能不是100%可比较的。
您需要使用类似于COCO script的脚本预处理数据。
在openimages发行版中提供了script推理,但它确实包含解包数据的代码。
最后,如果您完成此操作,我们会始终在我们的github models页面上以拉取请求的形式向您提供捐款。