Azure表单识别器-模型版本控制

时间:2020-08-05 10:33:35

标签: microsoft-cognitive form-recognizer

有关表单识别器(FR)模型管理的问题:

背景: 我正在使用FR标签工具来训练模型,并使用C#Function应用程序与FA服务进行交互并分析表单。

  1. 每次训练模型-创建一个新实例。新版本不包含对先前版本的任何引用,并且无法通过代码中的名称选择模型。可以使用TrainingCompletedOn属性查询最新模型,但是它不是故障转移,如果FR有多个项目,则不能使用该模型。问题:如果正在进行持续开发并且模型不断改进-是否有一种方法(或最佳实践)来管理必须定位的模型。
  2. 与第一个Q关联-由于FR总是创建一个新模型-因此最终会列出一大堆尚未使用的仍处于活动状态的模型。而且由于它们之间没有连接,因此没有安全的清除方法。可以使用API​​删除旧模型,但这是手动过程。关于如何管理旧模型版本的任何建议?
  3. 能否将模型导出到版本控制中并从版本控制部署到其他环境?有一个API端点可以在FR实例之间复制模型,但是我想将其保留在版本控制中并从那里部署到环境。
  4. 与Q3有关-在DevOps中管理FR项目的推荐做法是什么?如何在不同环境中对工作进行版本控制和部署?

谢谢

1 个答案:

答案 0 :(得分:0)

  1. 每个模型都是唯一且独立的。它是一成不变的,您需要根据测试数据集选择最准确的模型。
  2. 您可以调用DELETE api来删除模型。
  3. 目前还没有这种支持。由于每个模型在创建后都无法更改,因此我认为模型的版本控制没有太大价值。
  4. 请参阅#1,您可以使用测试数据集来衡量模型性能。如果模型在一个测试文件上的表现不佳,则可以标记该测试文件并将其添加到训练集中,然后训练新的(更好)模型。

-xin(MS表格识别器团队)