Question

上下文：自动取款机，我们使用Google的Tesseract生产OCR钱包。会创建（给正确的配置）一个PDF，该PDF包含初始图形以及所提取的/ OCRed文本的覆盖层。

由于各种原因，我们希望转至MS Cognition Services，它将返回我们像这样

{
  "language": "en",
  "textAngle": -2.0000000000000338,
  "orientation": "Up",
  "regions": [
    {
      "boundingBox": "462,379,497,258",
      "lines": [
        {
          "boundingBox": "462,379,497,74",
          "words": [
            {
              "boundingBox": "462,379,41,73",
              "text": "A"
            },
            {
              "boundingBox": "523,379,153,73",
              "text": "GOAL"
            },
            {
              "boundingBox": "694,379,265,74",
              "text": "WITHOUT"
            }
          ]
        },
}

所以我得到了提取的文本和边界框，但没有得到我仍然需要的PDF和覆盖图。

如何创建包含图形文件和边框信息的PDF文件？该解决方案应该可以在.dotnet或nodejs上运行。

如何将边界框信息叠加到JPG上并创建PDF

0 个答案: