创建带有相应标签的文档变体以进行AI培训

时间:2018-07-09 09:11:27

标签: machine-learning word-vba

我正在寻找以下问题的简单解决方案: 我必须创建文档的变体并将其导出为图像。使用MS Word邮件合并可以轻松完成此操作,但是我需要该文档中每个文本块的像素位置。输入图像以及像素位置以进行AI训练。

目前,我可以想到几种方法:

  1. 将“ MS Word邮件合并”输出扔到OCR中,并尝试通过与原始文本源进行比较来识别文本块的位置。
  2. 使用JS,Python或Visual Basic之类的文件创建文档,并在插入时保存每个插入的文本块的确切位置。
  3. 也许可以使用Visual Basic for Word从使用邮件合并功能创建的MS Word XML文件中提取文本位置。

变体1似乎过于复杂,因为它使用了某种反向工程。此外,即使在完全可读的文档上使用OCR也会始终是错误的根源。

所以变体2或3看起来不错,但我不知道任何符合要求的库,Visual Basic for Word对我来说绝对是新领域。

我希望我对问题的描述足够好。如果您想让我澄清一些事情,请告诉我。

我感谢每一个想法和帮助! :)

最佳问候 亨里克

1 个答案:

答案 0 :(得分:0)

似乎有人已经不喜欢我的帖子。请让我知道我如何才能改善投票。

无论如何,我可能已经找到了实现变体2的方法。该stackoverflow post引用了Github Gist,它扩展了Python图像库。它提供了在图像上写文本以及设置文本框最大宽度的功能。该函数还返回绘制的文本框的最终宽度和高度。使用这种方法,我将尝试实现一种算法,该算法可创建文档图像以及标签文件。

也许这也会帮助其他人寻找相同的东西。