我有一个客户管理它将WordprocessingML内容粘贴到我们的应用程序中。据我所知,它是从Word 2000直接复制和粘贴到我们的Java应用程序。我尝试了每个Word和Java版本的组合,但我无法重现这种行为 - 特别是,因为我们的应用程序过滤了HTML和text / plain。
我很确定旧的Office版本有自己的剪贴板并只导出格式,这些格式应该可供其他程序使用。我知道的每个办公室版本(2007年除外)都会导出HTML,RTF和Plain。
有没有办法将WordprocesingML内容放入剪贴板,也许是为了让Java混合数据风格
答案 0 :(得分:1)
Apache POI是一个访问Microsoft格式文件的Java API。 HWPF是阅读和编写MS Word文件的一部分。 Apache TIKA是一个工具包,用于使用现有的解析器库从各种文档中检测和提取元数据和结构化文本内容。它还为MS Word文档提供了一些支持。我建议你看看它们是否适合你的用例。