如何将边界框信息叠加到JPG上并创建PDF

时间:2019-02-21 12:32:25

标签: .net-core pdf-generation ocr

上下文:自动取款机,我们使用Google的Tesseract生产OCR钱包。会创建(给正确的配置)一个PDF,该PDF包含初始图形以及所提取的/ OCRed文本的覆盖层。

由于各种原因,我们希望转至MS Cognition Services,它将返回我们 像这样

{
  "language": "en",
  "textAngle": -2.0000000000000338,
  "orientation": "Up",
  "regions": [
    {
      "boundingBox": "462,379,497,258",
      "lines": [
        {
          "boundingBox": "462,379,497,74",
          "words": [
            {
              "boundingBox": "462,379,41,73",
              "text": "A"
            },
            {
              "boundingBox": "523,379,153,73",
              "text": "GOAL"
            },
            {
              "boundingBox": "694,379,265,74",
              "text": "WITHOUT"
            }
          ]
        },
}

所以我得到了提取的文本和边界框,但没有得到我仍然需要的PDF和覆盖图。

如何创建包含图形文件和边框信息的PDF文件? 该解决方案应该可以在.dotnet或nodejs上运行。

0 个答案:

没有答案