我需要构建OCR scraper

时间:2017-04-21 10:52:53

标签: ocr screen-scraping uipath

我希望能够构建OCR抓取应用程序,它们能够:

  1. 自动检测我们的计算机上运行预定软件的时间(我们需要废弃的软件示例:Web浏览器,或任何软件窗口,例如word,媒体播放器,powerpoint,游戏软件或其他......)。它应该能够检测到该窗口何时在用户屏幕中移动并跟随它。有时窗口可以暂时隐藏或重叠扫描的窗口:我们的刮刀必须能够处理这些情况并在这种情况下继续扫描。
  2. 当检测到其中一个预定的软件正在运行时,它应该自动打开一个特定的Excel文件来导出数据。
  3. 实时对该窗口进行OCR扫描,当扫描窗口中发生预定事件时,启动数据提取(自预定事件发生以来超过1秒的游戏时间)
  4. 数据可能是:文本,数字,图像的OCR识别,或者只是窗口中预定像素的颜色。
  5. 提取信息并将其粘贴到打开的Excel工作表的特定单元格中。 (请让我知道您的软件允许的其他目标输出格式。)
  6. 每次粘贴后,
  7. 在excel输出文件中调用一个宏。
  8. 将每个粘贴的副本保存在存储在确定目录中的excel文件中(当必须保存和存储新副本时,此操作不需要打开excel,它应该在后台完成)。
  9. 几个刮刀应该能够在同一台计算机上同时工作。例如,有两个刮刀从游戏软件中提取数据的情况+ 1刮刀同时从VLC上的电影中提取字幕。
  10. 所以在这个阶段,我想知道是否有现成的软件可以让我构建这样的抓取应用程序? (鉴于我不编码)。

    我用Google搜索并发现了uipath,但我不知道它的价值。

    另一种选择是聘请某人,但我希望将来能够自己这样做。

    谢谢

1 个答案:

答案 0 :(得分:0)

你需要专业人士来做这件事 - 或者至少花些时间来理解这个程序。 UiPath很可能会做到这一点,但没有任何经验需要一些时间。

我不认为UiPath能够同时运行多个机器人或作业 - 因此能够一次性扫描多个程序将会很棘手。