文件正文搜索

时间:2009-07-02 10:49:37

标签: php file search

任何人都可以推荐一个好的工具来搜索文件正文(office,powerpoint等)。它需要作为PHP站点的一部分进行集成。或者,可以用于创建搜索词索引的任何服务器端应用程序。

感谢

2 个答案:

答案 0 :(得分:3)

看看Zend_Lucene。它支持解析Word,Powerpoint和Excel(2007)文档。

答案 1 :(得分:0)

我知道如何获取正文的内容,但不知道搜索部分。这是我使用的功能:

function body($file) {
    $contents = file_get_contents($file);
    $parts = explode("<body>", $contents);
    $parts = explode("</body>", $parts[1]);
    return $parts[0];
}

当然,只有在body标签上没有任何属性时才能使用。