我正在使用rtesseract循环读取扫描的文档...我首先使用rmagick将pdf处理为jpg文件,然后将其循环并运行
files_to_convert.each do |tfile|
image = RTesseract.new(tfile, :lang => "slk")
final_text += image.to_s
end
在一定数量的文档(10-30)之后,系统用syslog中的消息杀死了工作
7月7日22:12:09 osboxes内核:[114590.313430]内存不足:杀死 过程23567(红宝石)得分510或牺牲孩子7月7日22:12:09 osboxes内核:[114590.313468]已杀死进程23567(红宝石) total-vm:3569292kB,anon-rss:2867500kB,file-rss:0kB
所以我试图通过简单的调用来实现垃圾收集器 在读取并处理了每个完整文档之后,GC.start保持不变,但是没有区别。经过一些文件系统后,工作就被取消了。
我有4GB的RAM用于开发虚拟机并运行ruby 2.2.3
谢谢