处理少量文档后,ruby rt​​esseract内存不足

时间:2018-07-07 21:27:45

标签: ruby

我正在使用rtesseract循环读取扫描的文档...我首先使用rmagick将pdf处理为jpg文件,然后将其循环并运行

files_to_convert.each do |tfile|

          image = RTesseract.new(tfile, :lang => "slk")

          final_text += image.to_s

       end

在一定数量的文档(10-30)之后,系统用syslog中的消息杀死了工作

  

7月7日22:12:09 osboxes内核:[114590.313430]内存不足:杀死   过程23567(红宝石)得分510或牺牲孩子7月7日22:12:09   osboxes内核:[114590.313468]已杀死进程23567(红宝石)   total-vm:3569292kB,anon-rss:2867500kB,file-rss:0kB

所以我试图通过简单的调用来实现垃圾收集器 在读取并处理了每个完整文档之后,GC.start保持不变,但是没有区别。经过一些文件系统后,工作就被取消了。

我有4GB的RAM用于开发虚拟机并运行ruby 2.2.3

谢谢

0 个答案:

没有答案