使用富媒体文件进行全文搜索

时间:2010-02-10 00:16:36

标签: php mysql search full-text-search rich-media

在富媒体文件中执行全文搜索的最佳方法是什么?我正在尝试实现一个用户可以上传随机文件(.doc,.pdf,.jpg,...)的系统,并且可以根据文件内容或元数据搜索它们。

我很欣赏有关如何构建此内容的一些想法。

PS - 我开始研究Lucene和Nutch,但我认为他们做的比我需要的更多。

谢谢。

1 个答案:

答案 0 :(得分:2)

你应该看看Tika(http://lucene.apache.org/tika/),这是一个检测和提取元数据和结构化文本的工具包。