在cassandra SASI自定义索引中,需要将Analyzer类从StandardAnalyzer更改为NonTokenizingAnalyzer。它会对任何手段造成影响吗?

时间:2018-02-16 13:55:55

标签: indexing database-design cassandra nosql cassandra-3.0

根据数据的搜索条件,哪个分析器随着时间的推移,磁盘空间成本更高?

注意:我使用NonTokenizing Analyzer来处理区分大小写的功能。

1 个答案:

答案 0 :(得分:1)

Analyzer_class:可以指定分析器来分析指定列中的文本。

  • NonTokenizingAnalyzer用于文本不是的情况 分析,但需要案例规范化或敏感性。
  • StandardAnalyzer用于涉及词干,案例的分析 规范化,区分大小写,跳过像“和”这样的常用词 “the”,以及用于完成分析的语言的本地化

因此,从StandardAnalyzer转移到NonTokenizingAnalyzer,您将失去跳过常用词,本地化等功能。因此,它实际上取决于您尝试解决的查询,确定切换。

就磁盘空间成本而言,StandardAnalyzer确实使用了更多,因为它必须处理更多,但也提供更多功能。所以这真的取决于你的用例。