有关Sql Server 2008 FullText搜索的问题

时间:2009-10-05 20:07:11

标签: sql sql-server full-text-search

我正在使用Sql Server 2008 FullText搜索项目。我需要能够搜索PDf文件,我有一些与之相关的问题:

  1. 如何启用PDF搜索?我听说过adobe过滤器,但找不到如何开始的明确指南。

  2. PDF文件是存储在数据库本身还是存储在文件系统中?我主要关注像DiscountASP这样的共享托管服务的空间。通常,我们只为DB提供大约100MB的空间,但文件系统的空间要多得多(以GB为单位)。 那么,如果这些PDF文件将直接存储在数据库中,那么它可能会变得昂贵,对吧?

  3. 我想提供搜索结果的摘要(例如Google)。如何使用Sql Server 2008 FTS实现这一目标?

3 个答案:

答案 0 :(得分:2)

听起来好像要使用Microsoft Indexing Services

这将索引文件系统上的文件,以便您可以搜索其内容。

以下是使用ASP.NET

查询索引服务的example

答案 1 :(得分:2)

全文搜索只能搜索数据库内容。它不会索引数据库之外的内容。正如您所知,全文可以通过programming API进行扩展,Adobe可以providers for PDF content进行扩展。 SQL Fulltext可以使用这些提供程序。

但是您可能感兴趣的还有另一个功能,即新的SQL 2008 FILESTREAM数据类型。文件流作为文件存储在文件系统中,但从事务处理,备份和恢复等角度来看,它们作为数据库的一部分进行维护。幸运的是FILESTREAM和FULL TEXT work together

答案 2 :(得分:1)

  1. 您需要PDF IFilter。 Here's来自Foxit Software的那个。
  2. 我相信如果PDF文件存储在数据库中,您只能使用“Sql Server全文搜索”。
  3. 除了打开文件并自己搜索每个结果的上下文之外,我还没有找到办法。