我尝试在Alfresco中集成OCR但没有成功。我安装
alfresco-community-installer-201612-win-x64
然后我在C:\ Program Files(x86)\ Tesseract-OCR
中安装tesseract然后我尝试将tesseract整合到露天,
首先我在C:\ alfresco-community bat文件OCR.bat
中创建REM to see what happens
echo from %1 to %2 >>C:\tmp\ocrtransform.log
copy /Y %1 C:\TMP\%~n1%~x1
REM call tesseract and redirect output to $TARGET
"C:\Program Files (x86)\Tesseract-OCR\tesseract.exe" C:\TMP\%~n1%~x1 %~d2%~p2%~n2 -l eng
del C:\TMP\%~n1%~x1
然后在" C:\ alfresco-community \ tomcat \ shared \ classes \ alfresco \ extension"
中添加了三个转换xmlocrpng-transform-context.xml
ocrjpeg-transform-context.xml
ocrtiff-transform-context.xml
然后在" C:\ TMP"
中使用ocrtransform.log创建一个空文件名和 从这个链接(https://docs.google.com/file/d/0B94FD2QmPSJCNHpuUVlicW95UjA/edit)下载这个罐子 并将此jar放在此路径中" C:\ Alfresco \ tomcat \ lib"。
我使用此链接
http://alfrescosolutionsv.blogspot.com/2014/07/alfresco-integration-with-tesseract.html
但没有工作。哪里弄错了?我还需要添加其他内容吗?
有任何建议,想法吗?
答案 0 :(得分:1)
我无法找到你遗失的地方。
我早先做了这件事。我做的是我只创建了一个上下文文件,一个bat文件,然后只安装tesseract。 Download this文件,只需将上下文文件放在"C:\alfresco-community\tomcat\shared\classes\alfresco\extension"
和
在这里蝙蝠文件C:\alfresco-community
并安装tesseract。
BoooM它已经完成......
答案 1 :(得分:0)
答案可能很晚,但我希望我的答案可以帮助其他人。
如果Alfresco的安装目录不是C:\ alfresco-community目录,则需要在上下文文件中编辑参数。并且不要忘记重启TomCat服务器。 例如下面的例子:
<value>C:\Windows\System32\cmd.exe</value>
<value>/C</value>
<value>dir D:\alfresco-community\ocr.bat</value>