我怎么能读取.doc文件并从php中获取特定的单词

时间:2016-09-07 11:24:55

标签: php phpoffice

我想阅读一个doc文件并从中获得一些结果。

例如: 如果我有一个文件 - file.doc

它有类似

的东西
  

恢复

     

姓名:john carter

     

地址:美国

     

我是一名php开发人员

然后我想要类似的东西:

array(
'name' => john carter
'Address' => USA 
)

并拒绝提供其他信息。

有可能吗?

我尝试过phpoffice,但我无法获得与我相关的任何内容。

我们可以轻松获取整个文件数据,但我无法识别我想要的任何内容。

我需要类似abbyy给图像到文本。

请有人帮助我。

1 个答案:

答案 0 :(得分:1)

PHP docx reader:将MS Word Docx文件转换为文本 该类可以将MS Word Docx文件转换为文本。

它可以从docx格式的压缩Microsoft Word文件中提取文件。

该类可以解析文档XML文件并提取它包含的文本。

来自问题的重新发现:https://stackoverflow.com/a/19503654/5212418