我目前正在尝试为我的网站开发一个基本的全文搜索,我注意到某些词语如“关于”被列为MySQL全文搜索的停用词。这对我来说并不太费心,因为搜索特定新闻的人不一定会使用“关于”这个词来搜索(但我当然不能代表所有人!)。但是,我希望有人可以告诉我有关停用词列表的理由。谢谢!
澄清: 我正在使用MyIsam作为我的全文表。停用词是MySQL不会索引的词(对于任何全文索引)。正如对此问题的评论所述,有一个完整的停用词列表,没有任何解释。我只想知道“他们”选择的背后是否存在理由。
答案 0 :(得分:8)
停用词只是英语中的常用词。在大多数情况下,如果您不对这些词语编制索引,那么您的搜索结果将更具相关性 - 您的索引将更小更快 -
您可以使用ft_stopword_file变量编辑停用词列表(或将其设置为''以将所有词语索引为长于或长于ft_min_word_len),以便更好地满足您的需求。您还可以使用ft_min_word_len变量更改最小索引字长,该变量由于同样的原因而存在。