我有一个表(我们称之为my_table
),有两个文本字段:title
和description
。我还有一个使用下一个源查询的索引(my_index
):
SELECT * FROM my_table;
当我需要从my_index
获取所有单词和频率时,我会使用以下内容:
$indexer my_index --buildstops word_freq.txt 1000 --buildfreqs
但是现在,我需要获得仅在title
列中显示的字词(以及它们的频率仅来自title
列)。这样做的最佳解决方案是什么?
修改 如果解决方案不会在磁盘空间上构建新索引,那将是完美的。
答案 0 :(得分:1)
创建一个新的“索引”,仅包含标题列。无需使用它构建物理索引,只需将它与--buildstops:)一起使用即可。
索引继承,允许在配置文件中使用非常紧凑的位创建
source my_index_title : my_index {
sql_query = SELECT id,title from my_table
}
index my_index_title : my_index {
source = my_index_title
path = /tmp/my_index_title
}