我正在寻找以下问题的简单解决方案: 我必须创建文档的变体并将其导出为图像。使用MS Word邮件合并可以轻松完成此操作,但是我需要该文档中每个文本块的像素位置。输入图像以及像素位置以进行AI训练。
目前,我可以想到几种方法:
变体1似乎过于复杂,因为它使用了某种反向工程。此外,即使在完全可读的文档上使用OCR也会始终是错误的根源。
所以变体2或3看起来不错,但我不知道任何符合要求的库,Visual Basic for Word对我来说绝对是新领域。
我希望我对问题的描述足够好。如果您想让我澄清一些事情,请告诉我。
我感谢每一个想法和帮助! :)
最佳问候 亨里克
答案 0 :(得分:0)
似乎有人已经不喜欢我的帖子。请让我知道我如何才能改善投票。
无论如何,我可能已经找到了实现变体2的方法。该stackoverflow post引用了Github Gist,它扩展了Python图像库。它提供了在图像上写文本以及设置文本框最大宽度的功能。该函数还返回绘制的文本框的最终宽度和高度。使用这种方法,我将尝试实现一种算法,该算法可创建文档图像以及标签文件。
也许这也会帮助其他人寻找相同的东西。