如何识别Alfresco 5.0中的文档并根据内容进行归档?

时间:2015-11-10 10:53:05

标签: alfresco

我有以下用例:

  1. 现有扫描程序扫描文档并通过WebDAV或共享网络驱动器将其存储到Alfresco
  2. 使用条形码分隔文档以识别客户和文档类型(例如账单)
  3. 如果文档到达共享驱动器,Alfresco应对其进行分析并将其(根据客户和文档类型)移动到合适的内部文件夹结构。
  4. 文件夹结构示例:

    • /扫描/
    • / customers / ExampleCustomer1 / bills
    • /客户/ ExampleCustomer1 /电子邮件
    • / customers / ExampleCustomer1 / hr
    • /客户/ ExampleCustomer2 /票据
    • / customers / ExampleCustomer2 / emails
    • /客户/ ExampleCustomer2 /小时

    问题:

    • 我需要在Alfresco中处理步骤3)以自动识别文件并将其归档?

    P.S。我知道存在像Ephesoft / Kofax这样的应用程序,但是我想在Alfresco中有一个模块,它可以帮助我完成工作,而不需要外部依赖。

2 个答案:

答案 0 :(得分:2)

我建议采用以下顺序:

1)您的扫描仪或其他(OCR)软件需要解释条形码并保存客户并在文档中的某处输入,例如在docx元数据中。(我不知道有一个露天模块在做ocr或条形码读取)

2)通过webdav上传后,您必须运行alfresco元数据提取操作,该操作必须使用露天规则脚本或行为从文档元数据中提取客户并输入到alfresco元数据中。

  • 使用规则,您可以选择“提取公共元数据字段”
  • 操作
  • 使用java行为,您可以调用相同的操作: Action action = actionService.createAction(“extract-metadata”);         actionService.executeAction(action,node);

此提取操作在此处描述:https://wiki.alfresco.com/wiki/Metadata_Extraction。您可能必须为条形码要求添加自定义代码。 (https://wiki.alfresco.com/wiki/Content_Transformation_and_Metadata_Extraction_with_Apache_Tika

3)露天规则脚本或行为现在可以通过阅读此露天元数据属性来移动您的文档。

答案 1 :(得分:0)

这是关于自定义类型的非常好的方法,让我深入了解Alfresco:

http://ecmarchitect.com/alfresco-developer-series-tutorials/content/tutorial/tutorial.html

Alfresco开发人员教程:http://ecmarchitect.com/alfresco-developer-series