我要求分块MS word文档,将这些块存储到DB并使用.net技术将它们合并为文档。
分析了不同的选项,比如DITA(但不是.Net炒作),使用openXML并不是那么灵活 - 不能将带有格式的文件(富文本)的extrat数据。
有没有可行的方法呢?
示例文档格式:
Document1(ID)
Topic1
SubTopics
SubSubTopics
Topic2
SubTopics
SubSubTopics
我想将文档内容拆分为:
文档1(ID) TOPIC1
文档1(ID) SubTopics1 ...
OpenXML面临的问题:
Chunks需要由AltChunk或DocumentBuiler完成,不确定我们如何根据结构化格式进行分块。
如果我们将customeXML与内容控件一起使用 - 样式和格式无法保留在customeXML中