我正在寻找一种在Java应用程序中读取Microsoft Works(.wps)和One Note(.one)文件的方法。实际上,我所关心的只是从这些文件中提取可读文本,因此我可以将它们编入索引。
我成功地使用Apache POI和Tika库从大多数其他Micrososft格式中提取文本,但这两个仍然难以捉摸。
谢谢, 弗兰克
答案 0 :(得分:3)
据我所知,.one(One Note)文件格式是专有的,但有一个COM API: http://msdn.microsoft.com/en-us/library/ms788684(office.12).aspx#Office2007OneNoteWhatsNew_OneNote2007COMAPI您可以编写一些内容来转换另一种语言的数据并调用它吗?
一些谷歌搜索显示可以转换wps文件的程序,但我没有看到任何java api或任何文档。这可能是可行的。不确定您要处理多少个文件,但是您可能需要使用其他应用程序来转换文件,或者让用户运行另一个应用程序来首先转换它?