训练不完整标签的数据集

时间:2019-08-04 15:16:21

标签: python tensorflow keras resnet

我有一个问题,我有大约1万张带标签的图像用于语义分割。这些标签带有8种不同的类别标签。

对于其中的大约4k,我有一个额外的标签用于另一个(但非常相似的问题)。我可以将这些标签转换为适合原始问题的方法,从而将8个类扩展到9个。现在,我希望在这9个类上进行训练,而不会浪费缺少这些多余类标签的6k类。

计划是如此

  1. 6k训练8节课
  2. 根据(1)的权重初始化9类的新网络
  3. 冻结除得分层以外的所有内容并重新训练4k集
  4. 再次训练4k,但重量从(3)开始加载

我已经这样做了,并尝试了step(4)的多种操作。我逐步冻结了阶段(Resnet50),并尝试降低学习率。没有一个达到类似的性能。由于增加了复杂性,我预计会有所下降,但是将一类分成两类时,问题非常相似。我希望这两个类之间会有些混乱,但是其他所有类都无法正常执行。

扩展问题的正确方法是添加一个额外的类标签,其中并非所有数据集都包含该额外标签。

0 个答案:

没有答案