Sphinx Search / MySQL查找最常用的单词

时间:2012-02-10 10:52:02

标签: mysql full-text-search sphinx

我有一个sphinx搜索索引,想查找索引中最常用的单词。 理想情况下,有一个按频率排序的单词列表。

如果使用Sphinx无法做到这一点,有没有办法查询mysql表的文本字段以获得相同的统计数据?

2 个答案:

答案 0 :(得分:5)

是。这很简单。使用--buildstops和--buildfreqs使用索引器构建它们 标志。

indexer --config /path/to/sphinx.conf  indexName --buildfreqs --buildstops freq_wordlist.txt 100000

此示例为您提供按其频率

排序的sphinx索引中的前100000个单词

答案 1 :(得分:0)

  

使用--buildstops和--buildfreqs标志使用索引器构建它们。

请注意,这不是从现有索引构建的,而是针对数据源运行,就像索引一样,并构建单词频率。它不会影响索引本身。

如果您使用delta索引保存最后一个索引文档的ID,这将读取上次保存的ID并从那里开始工作。