从Word Document获取所有书签 - android

时间:2015-01-22 21:14:46

标签: android

是否可以在Android中获取Word文档中的所有书签?

我需要从word文档中提取所有书签,以便我可以存储它们。

有可能吗?

1 个答案:

答案 0 :(得分:2)

您可以使用JODConverter(Java API)。信息可在此处获得: http://www.artofsolving.com/opensource/jodconverter

以下是使用JODConverter执行此操作的示例:

 File docFile = new File(“document.doc”);
 File htmlFile = new File(“document.html”);
 // connect to an OpenOffice.org 
 OpenOfficeConnection openConnection = new SocketOpenOfficeConnection(8100);
 openConnection.connect();

 DocumentConverter converter = new OpenOfficeDocumentConverter(openConnection);
 converter.convert(docFile, htmlFile);
 // close the connection
 openConnection.disconnect();

 //Finally read the HTML from the htmlFile. You can read it as a String

或TextMining Extractors。它是Maven上提供的Java API。要使用此API,请将以下内容添加到Gradle文件中:

'org.textmining:tm-extractors:0.4'

如果您使用的是Maven,请在您的pom文件中添加以下工件:

<dependency>
  <groupId>org.textmining</groupId>
  <artifactId>tm-extractors</artifactId>
  <version>0.4</version>
</dependency>

或者,如果您只想使用从这里下载的JAR: http://mvnrepository.com/artifact/org.textmining/tm-extractors/0.4