我目前正在Java中实现Oracle OutsideIn搜索和导出工具,以提取不同文件的元数据和内容。我能够在文件夹中的多个文件上执行此操作,但是我无法提取嵌入在另一个文件中的文件。我想知道在搜索和导出中是否可行。
如果没有,我会选择CleanContent,但它只接受Microsoft和PDF文件。
答案 0 :(得分:1)
搜索导出可以从存档或其他类型的文件中转换或提取嵌入文件。我们区分了三种不同类型的嵌入,每种嵌入都有自己的选项来控制它们的转换。这三种类型是归档子文档,电子邮件附件和通用嵌入。默认情况下,前两个转换,但第三个不转换。要启用通用嵌入转换,请在SCCOPT_XML_SEARCHML_FLAGS选项中设置SCCEX_XML_EMBEDDINGS标志。如果您使用随SDK提供的导出器示例应用程序,请尝试在CFG文件中启用以下内容。
embeddingsflag yes
如果您尝试提取嵌入的二进制副本,则它将成为一个三步过程。在初始转换时,在SCCOPT_XML_SEARCHML_FLAGS选项中设置SCCEX_XML_PRODUCEOBJECTINFO标志。使用该信息进行所需的嵌入,以填充传递给DAOpenDocument的SCCDAOBJECT结构。从该函数返回的hDoc可以传递给DASaveInputObject以保存嵌入的二进制副本。这适用于上述三种类型的嵌入中的任何一种。没有Java示例应用程序演示此过程。