上下文:自动取款机,我们使用Google的Tesseract生产OCR钱包。会创建(给正确的配置)一个PDF,该PDF包含初始图形以及所提取的/ OCRed文本的覆盖层。
由于各种原因,我们希望转至MS Cognition Services,它将返回我们 像这样
{
"language": "en",
"textAngle": -2.0000000000000338,
"orientation": "Up",
"regions": [
{
"boundingBox": "462,379,497,258",
"lines": [
{
"boundingBox": "462,379,497,74",
"words": [
{
"boundingBox": "462,379,41,73",
"text": "A"
},
{
"boundingBox": "523,379,153,73",
"text": "GOAL"
},
{
"boundingBox": "694,379,265,74",
"text": "WITHOUT"
}
]
},
}
所以我得到了提取的文本和边界框,但没有得到我仍然需要的PDF和覆盖图。
如何创建包含图形文件和边框信息的PDF文件? 该解决方案应该可以在.dotnet或nodejs上运行。