我正在尝试使用带有标签工具的Azure Form Recognizer来训练和提取图像中的文本。 根据文档:
首先,确保所有培训文件的格式相同。如果您有多种格式的表单,请根据通用格式将它们组织到子文件夹中。训练时,您需要将API定向到子文件夹。 ( https://docs.microsoft.com/en-us/azure/cognitive-services/form-recognizer/quickstarts/label-tool#set-up-input-data )
就我而言,我有不同格式的图像。我可以创建不同的项目,标记图像,对其进行训练并获得预期的输出。 对于我而言,挑战在于,如果我采用这种方法,则需要创建不同的项目,分别进行培训并维护多个模型ID。
所以我只是想知道有什么方法可以将不同格式一起训练为一个训练模型?基本上我想知道我们是否可以使用单一模型ID从不同格式的图像中提取键值对?
答案 0 :(得分:1)
这是一些客户要求的功能。我们正在为此寻求解决方案,预计将在几个月后推出。目前,我们建议您分别训练模型并维护多个模型ID。
答案 1 :(得分:0)
如果这些只是几种不同的类型(例如2-4),并且很容易区分,那么您也可以尝试一起训练它们。但是,要使其正常工作,您将需要标记更多文件,并且结果仍然可能不如单独的模型好。
要进行尝试,请将每种类型的大约相同数量的图像全部放置在同一文件夹中,并一起标记。
如果类型很多,这不太可能。