Question

我正在创建将发票图像转换为可编辑格式（同时转换文本和表格数据）的软件。到目前为止，我已经在python中找到了轮廓以将图像转换为较小的块，这有助于查找文本的位置，Tesseract用于将这些图像转换为文本。

我已经提取了文本，但是现在的问题是将这些文本放在简单的记事本或Word文档或您建议的其他任何文件中的已知位置。

发票示例：

Answer 1

i建议您使用 pytesseract 其简单的Python光学字符识别功能，这是示例代码

var text1 =`#include<stdio.h>
            #include<conio.h>
            void main()
              {
                printf("Hello World");
              }`

将发票图像转换为可编辑格式

1 个答案: