我对SAP OCR服务的参数有一些疑问。 如Documentation中所述,页面分割模式和机器学习模型的类型有几个不同的选项。 这些参数的描述确实很简短。有谁知道我在哪里可以找到更详细的说明?
有关模型类型的问题
关于不同的modelTypes,我想知道lstmPrecise,lstmFast和lstmStandard之间的区别。我熟悉LSTM单元,但是没有找到有关使“精确模型”变得精确,使“快速模式”变得如此快速等等的任何信息。
还有一个带有“ LSTM单元和标准处理算法”的模型。有什么信息使用什么标准处理算法?
我也在寻找有关训练这些模型的信息。
有关pageSegMode的问题
大多数选项都是不言自明的,但是我偶然发现了pageSegmode 13-“粗线。将图像视为单个文本行,绕过Tesseract特有的hacks”。 我知道Tesseract是光学字符识别的免费软件。 SAP OCR服务是否基于Tesseract提供? 会绕开哪些针对Tesseract的骇客?
我真的希望有人可以帮助我解决这个问题,或者至少有一个可能知道这一点的想法。
提前致以最诚挚的问候,