Alfresco集成了OCR

时间:2017-01-14 15:41:35

标签: ocr alfresco tesseract

我尝试在Alfresco中集成OCR但没有成功。我安装

 alfresco-community-installer-201612-win-x64 

然后我在C:\ Program Files(x86)\ Tesseract-OCR

中安装tesseract

然后我尝试将tesseract整合到露天,

首先我在C:\ alfresco-community bat文件OCR.bat

中创建
REM to see what happens
echo from %1 to %2 >>C:\tmp\ocrtransform.log

copy /Y %1 C:\TMP\%~n1%~x1

REM  call tesseract and redirect output to $TARGET
"C:\Program Files (x86)\Tesseract-OCR\tesseract.exe" C:\TMP\%~n1%~x1 %~d2%~p2%~n2 -l eng
del C:\TMP\%~n1%~x1

然后在" C:\ alfresco-community \ tomcat \ shared \ classes \ alfresco \ extension"

中添加了三个转换xml
ocrpng-transform-context.xml

ocrjpeg-transform-context.xml

ocrtiff-transform-context.xml

然后在" C:\ TMP"

中使用ocrtransform.log创建一个空文件名

和 从这个链接(https://docs.google.com/file/d/0B94FD2QmPSJCNHpuUVlicW95UjA/edit)下载这个罐子 并将此jar放在此路径中" C:\ Alfresco \ tomcat \ lib"。

我使用此链接

http://alfrescosolutionsv.blogspot.com/2014/07/alfresco-integration-with-tesseract.html

但没有工作。哪里弄错了?我还需要添加其他内容吗?

有任何建议,想法吗?

2 个答案:

答案 0 :(得分:1)

我无法找到你遗失的地方。

我早先做了这件事。我做的是我只创建了一个上下文文件,一个bat文件,然后只安装tesseract。

Download this文件,只需将上下文文件放在"C:\alfresco-community\tomcat\shared\classes\alfresco\extension"和 在这里蝙蝠文件C:\alfresco-community并安装tesseract。

BoooM它已经完成......

答案 1 :(得分:0)

答案可能很晚,但我希望我的答案可以帮助其他人。

如果Alfresco的安装目录不是C:\ alfresco-community目录,则需要在上下文文件中编辑参数。并且不要忘记重启TomCat服务器。 例如下面的例子:

    <value>C:\Windows\System32\cmd.exe</value>
    <value>/C</value>
    <value>dir D:\alfresco-community\ocr.bat</value>