我遇到了Ocropus 4.4的问题。 (开源OCR)。我在this script之后安装了Ocropus和必要的库。编译/安装没有任何问题。
然而,在成功安装ocropus之后,我无法运行任何ocropus- *命令。 Ocropus-page和ocropus-hocr崩溃,没有给出任何错误有意义的消息。经过2分钟的处理后,我才得到一个神秘的死神。
ocropus-pages page_001.jpeg
[note] line recognizer: >
[note] *** 1 page_001.jpeg ***
Killed
我不知道从哪里开始修复它。有谁知道从哪里开始?
我的机器是XUbuntu 10.4 64bits(在VirtualBox中运行),512MB基本内存。
答案 0 :(得分:0)
我会尝试在处理之前将图像转换为未加载的tiff。我知道ocropus正在与tesseract紧密合作,而tesseract最好处理1bpp未压缩的tiffs。
答案 1 :(得分:0)
尽管这是一个老问题,但我认为我发布了一个解决方案/一些调试技巧,因为我在相同的情况下遇到了同样的问题。场景是:Debian在VirtualBox下运行,512MB RAM
为了调试" Killed"您应该查看/var/log
的消息以获取帮助。在我的情况下,kern.log包含:
debian kernel:[89675.791910]内存不足:终止进程13004 (ocropus-rtrain)得分806或牺牲孩子
debian kernel:[89675.791951]杀死过程13004(ocropus-rtrain) total-vm:800816kB,anon-rss:412424kB,file-rss:4kB
您可能需要增加分配给VM的资源量,特别是如果您在后台运行一些大型花式窗口管理器!