需要帮助来分离出文件处理服务器

时间:2018-04-10 12:35:44

标签: java linux amazon-ec2 ocr

我开发了具有Document Management System (DMS)功能的OCR。但是,处理too much time需要high CPU usage

我当前的流程是同步的,如下所示:

  1. 用户上传文件
  2. OCR流程
  3. 将文档信息存储在DB
  4. 考虑到实时生产负载,我想在dedicated file processing separate server上异步进行第二步。

    我的问题是,

    1. 这是正确的方法吗?
    2. 如何将该文件发送/检索到另一台服务器进行处理?我还发现使用消息队列,但我无法在其中添加整个文件。
    3. 无论如何,我们可以确认流程完成吗?

1 个答案:

答案 0 :(得分:0)

为解决这个问题,我已经成功地在单独的文件处理服务器上分离了OCR进程,这确实帮助我使用FIFO方法来解决CPU使用率过高的问题。

遵循以下步骤:

  1. 用户上传文件
  2. OCR状态待定
  3. 单独的服务器进程文件,该文件每次按FIFO方法暂挂。
  4. 更新数据库中的OCR进程状态。

以后可以根据服务器的需求和负载来增加处理服务器。