将发票图像转换为可编辑格式

时间:2019-05-24 22:36:55

标签: python opencv ocr

我正在创建将发票图像转换为可编辑格式(同时转换文本和表格数据)的软件。到目前为止,我已经在python中找到了轮廓以将图像转换为较小的块,这有助于查找文本的位置,Tesseract用于将这些图像转换为文本。

我已经提取了文本,但是现在的问题是将这些文本放在简单的记事本或Word文档或您建议的其他任何文件中的已知位置。

发票示例: enter image description here enter image description here

1 个答案:

答案 0 :(得分:0)

i建议您使用 pytesseract 其简单的Python光学字符识别功能,这是示例代码

var text1 =`#include<stdio.h>
            #include<conio.h>
            void main()
              {
                printf("Hello World");
              }`