我正在准备我自己的数据集来训练attention_ocr模型。我正在尝试修改this script以准备我的数据集。指定image/class/label的目的是什么(对于起始,对于attention_ocr,它似乎是image/class),以及它是如何被attention_ocr使用的?
答案 0 :(得分:0)
'图片/类' feature用于存储字符ID,attention_ocr使用此字段作为label - 模型学习使用图像作为输入生成这样的id序列。字符ID和实际utf8字符之间的映射是通过DEFAULT_CONFIG['charset_filename']中指定的TSV文件定义的。