标签: xml extract openxml docx office-2010
如果目标是能够将开放XML转换为不太复杂的XML,那么从2010 docx中提取文本和内联标记(粗体,斜体等)的最佳工具是什么?
想到的一个想法是将docx转换为另一种格式。如果是这样,您会建议哪种格式以及哪种程序(最好是开源)?
任何其他想法(即不同的方法)? MSOffice 2007似乎还有很多工具.Xpath,XQuery和XSLT是否可行,如果是这样的话 为什么 ?
请耐心等待。我是这方面的初学者,我也很乐意欢迎有关最好的知识来源的指示。
xlixol