如何将pdf,ppt,xl,doc文件内容读入php / python中的字符串

时间:2010-04-14 07:59:00

标签: php python file

请给我建议任何内置的命令或包?

3 个答案:

答案 0 :(得分:2)

嗯,从网上找东西应该不会太难。这是一个名为pyPDF的Python。检查PyPi是否也有这些模块。至于阅读doc,ppt,xls文件,一种方法是使用COM

答案 1 :(得分:1)

“二进制”或实际文本中的内容?

在php中将文件读为“二进制”: http://php.net/manual/en/function.file.php

在python中: http://docs.python.org/tutorial/inputoutput.html#reading-and-writing-files

实际上阅读文件的内容要困难得多,并且需要additonall库。比如在SO(Python)上看一下这个问题: python convert microsoft office docs to plain text on linux

答案 2 :(得分:0)

试试这个:

$data = fopen('myfile.png', 'rb'); // read in binary mode.

if ($data) {
  header('Content-Type: image/png');
  fpassthru($data);
}

您应该相应地更改content-type