扩展Orchard的搜索/索引模块,以搜索上传的Word,Excel,Powerpoint和PDF文件

时间:2013-07-08 10:38:01

标签: pdf indexing ms-office orchardcms orchardcms-1.6

显然,以下模块仅为Orchard站点中的内容编制索引:

http://docs.orchardproject.net/Documentation/Search-and-indexing

如果我上传DOC,XLS,PPT或PDF文件,其内容不会被添加到索引中。

是否有开箱即用的方式来包含这些内容,还是我必须扩展索引机制?

如果后者是真的,欢迎任何提示如何做到这一点。谢谢!

编辑通过'上传文件',我的意思是将标准媒体上传到/Media文件夹。

1 个答案:

答案 0 :(得分:1)

它不是开箱即用的,但可以自己实现,尤其是即将推出的Orchard 1.7,它将生成上传的媒体文件内容项。

这有一些扩展点,OnIndexing<T>内容处理程序方法是最简单易用的。这是提取关键字并将其添加到索引的地方。查看示例的现有实现。

说到关键字提取 - 我使用iTextSharp表示PDF和MS OpenXML SDK 2.0处理Office文档(虽然它只适用于新格式--DOCX,PPTX和XLSX)。对于传统的非XML Office格式,您需要一些其他库 - 网上有很多这样的库。