Question

我有jpeg格式的过去一年的每日数据，看起来像

我如何将jpeg转换为excel表？

Answer 1

我将首先测试所有online OCR providers，例如ocr.space或google云视觉。它们代表了市场上最好的通用文本OCR。

如果它们适合您，您可以看到开源Tesseract OCR是否也适合您。优点是，您可以在本地运行它。

这些服务将数据作为带有坐标的单词返回。您将需要解析此原始数据并将各种坐标分配给列和行。

"ParsedResults" : [
            {
                "TextOverlay" : {
                    "Lines" : [
                        {
                            "Words": [
                                {
                                "WordText": "Word 1",
                                "Left": 106,
                                "Top": 91,
                                "Height": 9,
                                "Width": 11
                                },
                                {
                                "WordText": "Word 2",
                                "Left": 121,
                                "Top": 90,
                                "Height": 13,
                                "Width": 51
                                }
                                .
                                .
                                .
                                More Words
                            ],
                            "MaxHeight": 13,
                            "MinTop": 90
                        },
                        .
                        .
                        .
                        .
                        More Lines
                    ],

话虽如此，对于OCR来说，图像看起来很难非常，特别是如果您需要高精度的数字。示例：如果OCR返回＆＃34; 290＆＃34;而不是＆＃34; 2900＆＃34;这是个大问题吗？

如何将电子表格的图像转换为电子表格

1 个答案: