Alfresco ECM内容转换

时间:2011-04-15 18:09:36

标签: alfresco

我正在使用Alfresco ECM使用Tiger OCR库()

将TIFF转换为PDF

我的自定义转换xml(ocr-transformers-context)是

<?xml version='1.0' encoding='UTF-8'?>
<!DOCTYPE beans PUBLIC '-//SPRING//DTD BEAN//EN' 'http://www.springframework.org/dtd/spring-beans.dtd'>

<beans>

   <bean id="transformer.Ocr.Tiff2Pdf" class="org.alfresco.repo.content.transform.RuntimeExecutableContentTransformerWorker">
      <property name="checkCommand">
         <bean class="org.alfresco.util.exec.RuntimeExec">
            <property name="commandsAndArguments">
                <map>
                    <entry key=".*">
                    <list>
                        <value>c:\ocr\ocr.exe</value>
                        <value>--about</value>
                    </list> 
                    </entry>
                </map>
            </property>

         </bean>
      </property>
      <property name="transformCommand">
         <bean class="org.alfresco.util.exec.RuntimeExec">
            <property name="commandsAndArguments">
                <map>
                    <entry key="Windows.*">
                    <list>
                        <value>c:\ocr\ocr.exe</value>
                        <value>--replace</value>
                        <value>--replace</value>
                        <value>--language en</value>
                        <value>--pdf</value>
                        <value>--output-file</value>
                        <value>${target}</value>
                        <value>${source}</value>
                    </list>                     
                    </entry>
                </map>
            </property>

         </bean>
      </property>
      <property name="explicitTransformations">
         <list>
            <bean class="org.alfresco.repo.content.transform.ExplictTransformationDetails" >
                <property name="sourceMimetype"><value>image/tiff</value></property>
                <property name="targetMimetype"><value>application/pdf</value></property>
            </bean>
            <bean class="org.alfresco.repo.content.transform.ExplictTransformationDetails" >
                <property name="sourceMimetype"><value>image/tiff</value></property>
                <property name="targetMimetype"><value>text/plain</value></property>
            </bean>         
         </list>
      </property>
   </bean>
</beans>

当我将TIFF文件导入Company Home文件夹时,我现在希望将内容转换为PDF。现在我正确地假设转换是自动的,还是我需要在空间上调用规则?

另外,我已将转换的日志记录设置为DEBUG,这就是我在Alfresco日志中看到的内容

  

DEBUG [util.exec.RuntimeExec]   执行结果:os:
  Windows XP命令:
  [c:\ ocr \ ocr.exe, - about]
  成功:真正的退出代码:0
  out:Intelliant OCR命令行   实用程序,版本1.1.0。版权所有©   2006。

     

现金:

     

TIFF图书馆版权所有(c)   1988-1997 Sam Leffler版权所有(c)   1991-1997 Silicon Graphics,Inc。

     

独立JPEG组图书馆
  版权所有(C)1991-19   用户:admin DEBUG   [content.transform.ContentTransformerRegistry]   搜索变压器:源   mimetype:image / tiff目标   mimetype:text / plain变形金刚:   []

当我真正需要将其转换为PDF时,似乎正在搜索text / plain的目标。我在这里错过了什么?请帮忙

1 个答案:

答案 0 :(得分:1)

唯一可以自动运行的转换是text plain文本,用于全文索引。

如果您使用的是Share,那么Share会尝试为您进行两次转换。首先,当您查看包含文件的文件夹时,它会尝试生成缩略图(通过再现服务)。为此,您通常会定义一个从新的mime类型到image / jpeg的转换器。此外,当您在共享中查看文档详细信息时,它将尝试为您提供Web预览。

如果您希望在上传文档时生成PDF文档版本,则需要定义规则。您可以使用转换内容规则执行此操作,或者如果您希望对其进行大量控制,则可以编写脚本以使用“呈现服务”。