UiPath自动化工具 - 阅读带有OCR活动的pdf

时间:2016-07-26 19:59:22

标签: c# automation ocr text-extraction uipath

我想从UiPath中的pdf中提取文本并将其保存到excel或文本文件以使文本可编辑,但如果有人可以帮助我,我会发现这些问题:

1-当我使用"使用MS Office OCR阅读pdf"活动并将文本保存到文本文件,它将被创建但是为空。虽然它只适用于此示例中的Example.pdf文件: http://www.uipath.com/kb-articles/extract-text-with-ocr

2-当我使用Abby OCR并将AppID与密码放在一起时 - 我有ABBYY FineReader跟踪版本 - 显示例外。
消息:GDI +中发生一般错误 资料来源:Abbyy OCR
异常类型:ExternalException

3-如何将数据表中的行添加为字符串数据

Here 我的工作流程图片,用于提取pdf文件。

1 个答案:

答案 0 :(得分:1)

如果您没有使用Citrix自动化,那么已经有一个活动可用“阅读pdf ”,它将返回带有文本的输出。

附注 - 取决于Pdf数据,如果它只包含文本,那么它将全部返回,如果它是扫描图像pdf,那么你应该使用read pdf ocr方法。