我想阅读一个doc文件并从中获得一些结果。
例如: 如果我有一个文件 - file.doc
它有类似
的东西恢复
姓名:john carter
地址:美国
我是一名php开发人员
然后我想要类似的东西:
array(
'name' => john carter
'Address' => USA
)
并拒绝提供其他信息。
有可能吗?
我尝试过phpoffice,但我无法获得与我相关的任何内容。
我们可以轻松获取整个文件数据,但我无法识别我想要的任何内容。
我需要类似abbyy给图像到文本。
请有人帮助我。
答案 0 :(得分:1)
PHP docx reader:将MS Word Docx文件转换为文本 该类可以将MS Word Docx文件转换为文本。
它可以从docx格式的压缩Microsoft Word文件中提取文件。
该类可以解析文档XML文件并提取它包含的文本。