我正在寻找参考论文,在其中我可以发现迁移学习需要来自特定领域的源模型,而不是使用通用模型(即imagenet)
例如源数据集的植物卫星/无人机超/多光谱图像和目标数据集(使用农业机器人捕获的植物超/多光谱图像)
与
相比使用农业机器人捕获的植物的源数据集ImageNet模型和目标数据集图像
答案 0 :(得分:1)
如果您没有足够的数据,则转移学习对于准确性尤其有趣。例如,this paper比较了在imagenet上有和没有预训练的训练。他们声称,经过10k图像处理后,预训练并不能带来更好的结果,但仍然可以使训练速度更快。 然后,如果您的数据集很小,那么您的问题仍然是应该在imagenet还是另一个数据集上进行预训练。我认为下段给出了这个问题的答案(您可能会感兴趣的参考文献):
我们需要大数据吗?是的。但是,如果我们考虑到收集和清理数据的额外工作,那么通用的大规模分类级别的预训练集就不理想了-收集ImageNet的成本在很大程度上被忽略了,但是在此之前的“预训练”步骤实际上,当我们扩展此范式时,“预训练+微调”范式实际上并不是免费的。如果大规模分类级别的预训练的收益成倍减少[44,30],则在目标域中收集数据会更加有效。
因此,您还需要考虑卫星图像数据集的质量。由于它应该比Imagenet更接近您的数据,因此可能更好。