如何阅读每一页的单词?

时间:2014-12-04 14:35:15

标签: aspose aspose.words

我知道doc.Save()函数将所有页面保存在一个HTML文件中。 doc.RenderToScale()函数将每个页面保存到独立的图像文件中。 但我想在独立的HTML文件中读取或保存每个页面,我不知道,你能帮助我吗?

1 个答案:

答案 0 :(得分:2)

您可以使用以下代码示例将每个页面转换为HTML或Aspose.Words支持的任何其他格式。

String srcDoc = Common.DATA_DIR + "src.docx";
String dstDoc = Common.DATA_DIR + "dst {PAGE_NO}.html";

Document doc = new Document(srcDoc);
LayoutCollector layoutCollector = new LayoutCollector(doc);
// This will build layout model and collect necessary information.
doc.updatePageLayout();

// Split nodes in the document into separate pages.
DocumentPageSplitter splitter = new DocumentPageSplitter(layoutCollector);

// Save each page to disk as separate documents.
for (int page = 1; page <= doc.getPageCount(); page++)
{
    Document pageDoc = splitter.getDocumentOfPage(page);
    pageDoc.save(dstDoc.replace("{PAGE_NO}", page+""));
}

这取决于其他3个类,您可以在this zip file中找到它们。

我与Aspose一起担任开发者布道者。