我想知道从Microsoft word(.doc和.docx)文档中解析和获取文本内容的过程。使用的编程语言应该是简单的“C”(应该是gcc)。
是否有任何图书馆已经完成这项工作,
扩展名:我可以使用相同的程序解析Microsoft power point文件中的文本吗?
答案 0 :(得分:1)
我不知道存在的库,但格式规范可以免费从Microsoft获得,并承诺不会起诉你使用它们。
答案 1 :(得分:1)
答案 2 :(得分:1)
在Windows上,让word完成工作并与COM对象接口,在linux上,作业在antiword完成。或者,您可以使用OpenOffice.org对象模型在任何平台上自动UNO。
答案 3 :(得分:1)