标签: deep-learning ocr
现在,我有一个基于预训练的深度学习的OCR模型,但在我的实际应用中,存在一些未包含在我的预训练模型的字典中的字符。也有一个主要由那些新字符组成的小型数据集。我希望模型学会在不削弱其识别原始词典中字符的能力的情况下识别新字符。 但是,当我将这些新字符添加到模型的分类层并微调数据集的权重时,由于数据集的类分布不平衡,模型的性能将很差。有什么方法可以有效地将这些新角色导入我的预训练模型中?