我正在使用Alfresco ECM使用Tiger OCR库()
将TIFF转换为PDF我的自定义转换xml(ocr-transformers-context)是
<?xml version='1.0' encoding='UTF-8'?>
<!DOCTYPE beans PUBLIC '-//SPRING//DTD BEAN//EN' 'http://www.springframework.org/dtd/spring-beans.dtd'>
<beans>
<bean id="transformer.Ocr.Tiff2Pdf" class="org.alfresco.repo.content.transform.RuntimeExecutableContentTransformerWorker">
<property name="checkCommand">
<bean class="org.alfresco.util.exec.RuntimeExec">
<property name="commandsAndArguments">
<map>
<entry key=".*">
<list>
<value>c:\ocr\ocr.exe</value>
<value>--about</value>
</list>
</entry>
</map>
</property>
</bean>
</property>
<property name="transformCommand">
<bean class="org.alfresco.util.exec.RuntimeExec">
<property name="commandsAndArguments">
<map>
<entry key="Windows.*">
<list>
<value>c:\ocr\ocr.exe</value>
<value>--replace</value>
<value>--replace</value>
<value>--language en</value>
<value>--pdf</value>
<value>--output-file</value>
<value>${target}</value>
<value>${source}</value>
</list>
</entry>
</map>
</property>
</bean>
</property>
<property name="explicitTransformations">
<list>
<bean class="org.alfresco.repo.content.transform.ExplictTransformationDetails" >
<property name="sourceMimetype"><value>image/tiff</value></property>
<property name="targetMimetype"><value>application/pdf</value></property>
</bean>
<bean class="org.alfresco.repo.content.transform.ExplictTransformationDetails" >
<property name="sourceMimetype"><value>image/tiff</value></property>
<property name="targetMimetype"><value>text/plain</value></property>
</bean>
</list>
</property>
</bean>
</beans>
当我将TIFF文件导入Company Home文件夹时,我现在希望将内容转换为PDF。现在我正确地假设转换是自动的,还是我需要在空间上调用规则?
另外,我已将转换的日志记录设置为DEBUG,这就是我在Alfresco日志中看到的内容
DEBUG [util.exec.RuntimeExec] 执行结果:os:
Windows XP命令:
[c:\ ocr \ ocr.exe, - about]
成功:真正的退出代码:0
out:Intelliant OCR命令行 实用程序,版本1.1.0。版权所有© 2006。现金:
TIFF图书馆版权所有(c) 1988-1997 Sam Leffler版权所有(c) 1991-1997 Silicon Graphics,Inc。
独立JPEG组图书馆
版权所有(C)1991-19 用户:admin DEBUG [content.transform.ContentTransformerRegistry] 搜索变压器:源 mimetype:image / tiff目标 mimetype:text / plain变形金刚: []
当我真正需要将其转换为PDF时,似乎正在搜索text / plain的目标。我在这里错过了什么?请帮忙
答案 0 :(得分:1)
唯一可以自动运行的转换是text plain文本,用于全文索引。
如果您使用的是Share,那么Share会尝试为您进行两次转换。首先,当您查看包含文件的文件夹时,它会尝试生成缩略图(通过再现服务)。为此,您通常会定义一个从新的mime类型到image / jpeg的转换器。此外,当您在共享中查看文档详细信息时,它将尝试为您提供Web预览。
如果您希望在上传文档时生成PDF文档版本,则需要定义规则。您可以使用转换内容规则执行此操作,或者如果您希望对其进行大量控制,则可以编写脚本以使用“呈现服务”。