标签: python text-extraction vision
我有一些图像文件,这些文件的形式包含在大小不同的框中的文本(包含名称,日期,城市等信息)。图像文件不一致。它们具有不同的尺寸,边距,盒子的大小,但是它们的模板是相同的。
我尝试为单个图像文件注释每个框的坐标,并且尝试根据第一个图像文件的边界框的坐标从其他图像文件中提取文本。
如果图像文件与基本图像文件完全重叠,则可以提取文本。但是在其他情况下,我无法准确提取文本。有没有一种方法可以使用从基本图像文件中识别出的边界框准确地提取文本,即使图像文件不完全重叠(它们都遵循相同的模板)。