Kofax在不使用分隔页的情况下从支持文档中分离主发票

时间:2014-12-30 11:59:52

标签: vbscript ocr capture kofax

创建批次时,文档应自动分离,而不使用分隔页或条形码分隔符。

如何为发票和支持文档分类文档。 在我们的项目中,我们收到许多带有支持文档的发票,因此扫描人员必须手动插入分隔页,因此为了避免这种情况,我们希望自动对支持文档进行分类。

2 个答案:

答案 0 :(得分:0)

如果没有分隔页,您将需要一个智能分类软件,如Kofax Transformation Module(KTM)。它的价格昂贵。您需要验证成本节省和投资回报率。

答案 1 :(得分:0)

一般而言,概念是您将在项目中启用分离,然后使用示例来训练您的类,以用于布局或内容分类器。

但是,正如我相信您已经看到的那样,发票的障碍是它们在供应商之间的差异不足以使其无法将所有内容可靠地归类为Invoice类。与"支持文件类似#34;这可能是彼此非常不同的,所以不幸的是,没有分隔页(或附加到支持文档的条形码贴纸),没有完全简单的答案。

您可能想要做的是在一个分离事件中编写代码,例如Document_AfterSeparate事件。尽管有这个名字,但此时该文件还没有被拆分,但是分类器已经运行了。请参阅脚本帮助主题"服务器脚本事件序列>文档分离>标准文件分离"了解更多细节。在CDocPage(pXDoc.CDoc.Pages.ItemByIndex(lPage).SplitPage)上设置SplitPage属性将允许您使用自己的逻辑来确定要分离的页面。

例如,如果您知道您将始终拥有单页发票,则可以在第一页上拆分并进行相应的分类。或者您可以尝试搜索指示发票结束的内容,例如" Total"或其他特征。有一个示例说明如何使用定位器来帮助分离脚本帮助主题"脚本示例>使用定位器结果进行标准文档分离"。该示例使用条形码定位器,但如果您想使用格式定位器或其他任何东西尝试它,则相同的概念也适用。