应用错误收集

创建带有相应标签的文档变体以进行AI培训

时间：2018-07-09 09:11:27

标签： machine-learning word-vba

我正在寻找以下问题的简单解决方案：我必须创建文档的变体并将其导出为图像。使用MS Word邮件合并可以轻松完成此操作，但是我需要该文档中每个文本块的像素位置。输入图像以及像素位置以进行AI训练。

目前，我可以想到几种方法：

将“ MS Word邮件合并”输出扔到OCR中，并尝试通过与原始文本源进行比较来识别文本块的位置。
使用JS，Python或Visual Basic之类的文件创建文档，并在插入时保存每个插入的文本块的确切位置。
也许可以使用Visual Basic for Word从使用邮件合并功能创建的MS Word XML文件中提取文本位置。

变体1似乎过于复杂，因为它使用了某种反向工程。此外，即使在完全可读的文档上使用OCR也会始终是错误的根源。

所以变体2或3看起来不错，但我不知道任何符合要求的库，Visual Basic for Word对我来说绝对是新领域。

我希望我对问题的描述足够好。如果您想让我澄清一些事情，请告诉我。

我感谢每一个想法和帮助！：）

最佳问候亨里克

1 个答案:

答案 0 :(得分：0)

似乎有人已经不喜欢我的帖子。请让我知道我如何才能改善投票。

无论如何，我可能已经找到了实现变体2的方法。该stackoverflow post引用了Github Gist，它扩展了Python图像库。它提供了在图像上写文本以及设置文本框最大宽度的功能。该函数还返回绘制的文本框的最终宽度和高度。使用这种方法，我将尝试实现一种算法，该算法可创建文档图像以及标签文件。

也许这也会帮助其他人寻找相同的东西。