apache cassandra查询/全文搜索

时间:2010-08-09 23:01:07

标签: full-text-search full-text-indexing cassandra

我一直在玩apache的cassandra项目。做了一些阅读,我有一些相当复杂的例子,包括插入单个和批量数据集,检索基于键的单个和多个数据集。 我看过的一些文章包括

http://www.rackspacecloud.com/blog/2010/05/12/cassandra-by-example      http://github.com/digg/lazyboy     http://arin.me/blog/wtf-is-a-supercolumn-cassandra-data-model     http://www.sodeso.nl/?p=80

我对所解释的概念有了很好的把握,甚至实现了一个简单的应用程序。

这些文章都没有描述如何执行查询,例如,查询是用户输入的搜索词。

有谁知道如何或可以建议我如何执行此类查询? 或者也许是创建可搜索索引,全文搜索或任何甚至远程关闭的方法?

1 个答案:

答案 0 :(得分:3)

您可能会将文本拆分为单词,而不是将这些单词用作“索引”的键。每个单词都将包含时间戳排序列族,其中包含文章,消息等的ID列表。因此,您只能对键(单词)执行简单搜索。 搜索多个单词时,请在这些列族上使用交集。

这是一种非常简单的方法,如果您需要更复杂的查询,请查看Lucandra - http://github.com/tjake/Lucandra - Lucandra是一个全文搜索引擎,Cassandra作为后端存储。