任何人都可以推荐一个好的工具来搜索文件正文(office,powerpoint等)。它需要作为PHP站点的一部分进行集成。或者,可以用于创建搜索词索引的任何服务器端应用程序。
感谢
答案 0 :(得分:3)
看看Zend_Lucene。它支持解析Word,Powerpoint和Excel(2007)文档。
答案 1 :(得分:0)
我知道如何获取正文的内容,但不知道搜索部分。这是我使用的功能:
function body($file) {
$contents = file_get_contents($file);
$parts = explode("<body>", $contents);
$parts = explode("</body>", $parts[1]);
return $parts[0];
}
当然,只有在body标签上没有任何属性时才能使用。