如何将旧的MS Word文档转换为纯文本?

时间:2012-05-23 08:44:17

标签: php apache text ms-word

我想从MSword 03或更早版本获取文本内容。是否有可以执行此操作的脚本或软件包?

我可以从2007年文档的word文件中获取文本。我无法从旧版本(.doc)获得相同的内容。

我正在使用apache2和php mysql。

3 个答案:

答案 0 :(得分:1)

尝试catdoc,将任何.doc文件转换为纯文本。请参阅catdoc homepage

答案 1 :(得分:1)

这是http://obninsk.name/obninsk_doc/的ms word文档的PHP类。

答案 2 :(得分:1)

您可以使用LiveDocx处理所有MS Word文件,包括RTF http://www.phplivedocx.org/2009/08/13/convert-docx-doc-rtf-to-html-in-php/