全文检索入门书?

时间:2009-06-26 17:11:15

标签: database indexing full-text-search

任何人都可以推荐一本关于全文搜索的好书/论文/文章(并且可能是一般的索引)。我非常痴迷于必须了解我的应用程序幕后发生的事情,而且我很难理解为什么Sphinx和其他外部FTS让MySQL / MyISAM黯然失色。

5 个答案:

答案 0 :(得分:5)

为了从下到上了解全文搜索,我建议“管理千兆字节”。

http://www.cs.mu.oz.au/mg/

答案 1 :(得分:3)

我发现postgres全文搜索页面http://www.postgresql.org/docs/8.3/static/textsearch.html非常有启发性。

特别是:http://www.postgresql.org/docs/8.3/static/textsearch-intro.html

文本搜索运算符已存在于数据库中多年。 PostgreSQL有文本数据类型的〜,〜*,LIKE和ILIKE运算符,但它们缺少现代信息系统所需的许多基本属性:

  • 甚至没有语言支持 对于英语。正则表达式是 不够,因为他们不能 容易处理派生词,例如, 满足和满足。你可能会想念 包含满足的文件, 虽然你可能想 在寻找满足时找到它们。 可以使用OR进行搜索 对于多个派生形式,但这个 很乏味且容易出错(有些 话可以有几千 衍生物)。
  • 他们没有提供订购(排名) 搜索结果,这使他们 成千上万的无效 找到匹配的文件。
  • 他们往往很慢,因为有 没有索引支持,所以他们必须 处理所有文件 搜索范围。

答案 2 :(得分:3)

有一本优秀的免费信息检索书(Christopher D. Manning,Prabhakar Raghavan和HinrichSchütze,信息检索简介,剑桥大学出版社.2008),包括文本检索,免费(legit) here

答案 3 :(得分:2)

我会从this开始。它适用于SQL Server,但阅读不会受到影响,因为除了实现细节之外的许多概念(很可能)在数据库中都是相同的。

答案 4 :(得分:0)

“面向对象的文本检索架构”

http://lucene.sourceforge.net/papers/riao91.ps