我编写了一个工作流分发平台,主要用于不同文件类型的文本提取。它的工作原理是处理文件,然后对该文件中可文本提取的所有嵌入项进行递归。创建的每个工作项都由GUID唯一标识,并且还具有父GUID。对于没有嵌入项的文件,工作项GUID和父GUID相等。如果文件具有嵌入项,则为每个具有唯一GUID的嵌入项创建工作项,并且其父GUID等于文件的GUID。作为示例,Outlook消息文件可以包含附件,附件又可以包含附件(即,在Word文档中插入电子表格)。
我想提供一个接口,当完成原始文件处理中任何项目的递归时,该接口将向客户端发送通知。我已经编写了一个树形结构来做我想做的事情,但它似乎有点蹩脚和天真。是否有已知的模式或库提供我上面概述的内容?
答案 0 :(得分:1)
您可以使用四叉树和四元组。四元组通常用于地图应用程序,但使用四元组键,您还可以按不同的顺序对树进行排序。当您希望将并行进程分配给特定核心时,它可以帮助分布并行进程。