使用页面高度提取word文档的第一页内容

时间:2014-07-13 18:30:39

标签: java xml-parsing apache-poi openxml document

我需要通过解析文档的openxml从word文档中获取第一页内容。我理解word文档是可重排的,我无法提取特定页面的内容,因为没有关于隐式分页符的信息在openxml中。 但是使用页面高度信息和格式规范,如字体大小,图像高度,页面中输入的数量,我认为我可以提取第一页内容。 但我无法理解openxml中指定大小的单位。

<w:sectPr w:rsidR="00BE0591" w:rsidRPr="006534F8">
        <w:pgSz w:w="12240" w:h="15840"/>
        <w:pgMar w:top="1440" w:right="1440" w:bottom="1440" w:left="1440"     w:header="720" w:footer="720" w:gutter="0"/>
        <w:cols w:space="720"/>
        <w:docGrid w:linePitch="360"/>
    </w:sectPr>

任何人都可以根据页面高度计算帮助我创建逻辑以获取首页内容吗?

0 个答案:

没有答案