答案 0 :(得分:1)
我将首先测试所有online OCR providers,例如ocr.space或google云视觉。它们代表了市场上最好的通用文本OCR。
如果它们适合您,您可以看到开源Tesseract OCR是否也适合您。优点是,您可以在本地运行它。
这些服务将数据作为带有坐标的单词返回。您将需要解析此原始数据并将各种坐标分配给列和行。
"ParsedResults" : [
{
"TextOverlay" : {
"Lines" : [
{
"Words": [
{
"WordText": "Word 1",
"Left": 106,
"Top": 91,
"Height": 9,
"Width": 11
},
{
"WordText": "Word 2",
"Left": 121,
"Top": 90,
"Height": 13,
"Width": 51
}
.
.
.
More Words
],
"MaxHeight": 13,
"MinTop": 90
},
.
.
.
.
More Lines
],
话虽如此,对于OCR来说,图像看起来很难非常,特别是如果您需要高精度的数字。示例:如果OCR返回" 290"而不是" 2900"这是个大问题吗?