了解WordProcessingML标记并避免不必要的标记

时间:2010-03-11 10:31:58

标签: ms-word

我正在使用MS Word API生成.docx,其中包含从DB获取的数据,其中我正在应用相应的样式,字体,符号等。如果从数据库获取的数据非常庞大,那么在.docx文件中显示这些数据的问题。我发现内部MS Word 2007将通过标签写一些内容,这些标签可能不需要显示数据。因此,我正在计算转换为.xml文件时所需的MS Word标签是什么。这样我就可以避免不必要的标签,只构建显示数据所需的相应标签。因此,我计划使用所需的MS Word标记编写自己的.xml,而不是从.docx文件生成.XML

我的疑问是: -

1)在将.docx转换为document.xml期间,MS Word是否会产生一些可能不需要的标签是否正确?那会让它沉重吗?如果是这样,那么什么是标签,这样我就可以在使用自己的.xml文件编写时避免使用它们。 2)请发送链接以了解MS Word标签及其优点,哪些标签是必需的,哪些不是? 3)我的编写类似于document.xml(.docx转换)的新.xml的方法是否值得继续进行,以便我可以使用我需要的标记构建.xml,这样我就可以提高性能数据显示?

请详细说明并提前致谢..

谢谢, Rithu

1 个答案:

答案 0 :(得分:0)

您需要更多WordprocessingML了解detail才能执行此操作。这当然不是不可能,但从一开始就是一个学习曲线。可能最好的起点是这个eBook。如果你去手动路线,你需要一个拉链技术。如果您使用的是Visual Studio,则可以使用Open XML SDK轻松编写所有这些内容。

关于“不必要的标签”的问题,很难相信文件中根本没有必要的东西。但这取决于您认为不需要的内容 - 例如,如果一个单词被捕获为拼写错误,则Run标记上将出现“dirty = 1”属性。如果您可以显示拼写错误的单词,那么这可能被认为是不必要的。真的取决于你所展示的内容和内容。