我正在使用Sql Server 2008 FullText搜索项目。我需要能够搜索PDf文件,我有一些与之相关的问题:
如何启用PDF搜索?我听说过adobe过滤器,但找不到如何开始的明确指南。
PDF文件是存储在数据库本身还是存储在文件系统中?我主要关注像DiscountASP这样的共享托管服务的空间。通常,我们只为DB提供大约100MB的空间,但文件系统的空间要多得多(以GB为单位)。 那么,如果这些PDF文件将直接存储在数据库中,那么它可能会变得昂贵,对吧?
我想提供搜索结果的摘要(例如Google)。如何使用Sql Server 2008 FTS实现这一目标?
答案 0 :(得分:2)
答案 1 :(得分:2)
全文搜索只能搜索数据库内容。它不会索引数据库之外的内容。正如您所知,全文可以通过programming API进行扩展,Adobe可以providers for PDF content进行扩展。 SQL Fulltext可以使用这些提供程序。
但是您可能感兴趣的还有另一个功能,即新的SQL 2008 FILESTREAM数据类型。文件流作为文件存储在文件系统中,但从事务处理,备份和恢复等角度来看,它们作为数据库的一部分进行维护。幸运的是FILESTREAM和FULL TEXT work together。
答案 2 :(得分:1)