我正在创建将发票图像转换为可编辑格式(同时转换文本和表格数据)的软件。到目前为止,我已经在python中找到了轮廓以将图像转换为较小的块,这有助于查找文本的位置,Tesseract用于将这些图像转换为文本。
我已经提取了文本,但是现在的问题是将这些文本放在简单的记事本或Word文档或您建议的其他任何文件中的已知位置。
答案 0 :(得分:0)
i建议您使用 pytesseract 其简单的Python光学字符识别功能,这是示例代码
var text1 =`#include<stdio.h>
#include<conio.h>
void main()
{
printf("Hello World");
}`