我有一个sphinx搜索索引,想查找索引中最常用的单词。 理想情况下,有一个按频率排序的单词列表。
如果使用Sphinx无法做到这一点,有没有办法查询mysql表的文本字段以获得相同的统计数据?
答案 0 :(得分:5)
是。这很简单。使用--buildstops和--buildfreqs使用索引器构建它们 标志。
indexer --config /path/to/sphinx.conf indexName --buildfreqs --buildstops freq_wordlist.txt 100000
此示例为您提供按其频率
排序的sphinx索引中的前100000个单词答案 1 :(得分:0)
使用--buildstops和--buildfreqs标志使用索引器构建它们。
请注意,这不是从现有索引构建的,而是针对数据源运行,就像索引一样,并构建单词频率。它不会影响索引本身。
如果您使用delta索引保存最后一个索引文档的ID,这将读取上次保存的ID并从那里开始工作。