将PDF OLE对象转换回Lotus Notes中的文件(附件)?

时间:2012-10-23 08:57:11

标签: pdf apache-poi lotus-notes xpages ole

我有一个数据库,在Notes RichText字段中嵌入了大量PDF文档作为OLE对象。那些与XPage不兼容,所以我需要将OLE对象转换为文件(附件)s。 我怎么能以自动方式做到这一点(我知道它必须在Notes客户端中运行(必须吗?) - 或者是否有POI方式来提取它们?

澄清
我可以提取blob(如果需要,可以在内存中),但是将其写入磁盘不会创建PDF文件,因为该blob是一个OLE容器。所以我看到了两条可能的路径:

  • 激活OLE对象并使用其中的方法
  • 阅读blob并获取提取PDF部分的内容(可能是Apache POI

但我没有触及任何这些方法,并且想知道一些建议是否可以节省我数小时的测试

2 个答案:

答案 0 :(得分:1)

使用dxl工具是否可行?我和dxl导出器合作从文档中提取嵌入的图像,这可能也适用于ole对象吗?

我在openntf上使用了lotusscript黄金收集项目的EmbeddedImage对象的略微更改版本

该库包含一个对象Embeddedimagelist,它在DXL中搜索图片标签并尝试解析其内容。也许这也适用于嵌入式ole对象。

答案 1 :(得分:0)

我认为像搜索%PDF然后保存所有内容一样,因为文件应该是PDF格式。从理论上讲,OLE文件中可能有很多东西,但在大多数情况下,你会得到一个简单的前缀为OLE头文件(或者其他任何名称)的文件。

我曾经在一个场合使用过这种方法(虽然不是用于PDF),看起来效果很好。

我想这就是jjtbsomhorst所说的openntf方法基于: - )