如何将电子表格的图像转换为电子表格

时间:2017-10-26 09:34:33

标签: excel ocr

我有jpeg格式的过去一年的每日数据,看起来像 enter image description here

我如何将jpeg转换为excel表?

1 个答案:

答案 0 :(得分:1)

我将首先测试所有online OCR providers,例如ocr.space或google云视觉。它们代表了市场上最好的通用文本OCR。

如果它们适合您,您可以看到开源Tesseract OCR是否也适合您。优点是,您可以在本地运行它。

这些服务将数据作为带有坐标的单词返回。您将需要解析此原始数据并将各种坐标分配给列和行。

"ParsedResults" : [
            {
                "TextOverlay" : {
                    "Lines" : [
                        {
                            "Words": [
                                {
                                "WordText": "Word 1",
                                "Left": 106,
                                "Top": 91,
                                "Height": 9,
                                "Width": 11
                                },
                                {
                                "WordText": "Word 2",
                                "Left": 121,
                                "Top": 90,
                                "Height": 13,
                                "Width": 51
                                }
                                .
                                .
                                .
                                More Words
                            ],
                            "MaxHeight": 13,
                            "MinTop": 90
                        },
                        .
                        .
                        .
                        .
                        More Lines
                    ],

话虽如此,对于OCR来说,图像看起来很难非常,特别是如果您需要高精度的数字。示例:如果OCR返回" 290"而不是" 2900"这是个大问题吗?