在Ruby中的.docx文件中提取图像

时间:2016-07-19 20:47:59

标签: ruby-on-rails ruby docx

如何在Ruby中逐行提取docx文件中的图像?

无法找到任何这样做的宝石。

2 个答案:

答案 0 :(得分:1)

没有任何库(或至少不是专门用于此目的的宝石),这很容易。

你应该:

  • 解压缩文档(最好是在内存中)
  • 然后,您可以提取以下内容:word/media/*

其中*将是所有文件。

例如,您将拥有:

word/media/image1.png
word/media/image2.png

答案 1 :(得分:-1)

使用Jasper报告,您可以生成各种文档格式,包括HTML,PDF,Excel,OpenOffice和Word(DOCX)。

在我看来,您不需要gem,将jasper报告集成到您的项目中很简单。以下:https://www.sitepoint.com/create-great-reports-jasperreports/ 这个例子适用于rails,但它也适用于ruby项目。

注意:您需要在服务器端安装Java虚拟机。