弹性搜索的索引标准

时间:2015-10-30 15:31:13

标签: twitter elasticsearch

我正在使用twitter流API。并且对于确定索引数据的标准有点困惑。现在我有一个索引,其中包含一个doc_type中的所有推文和另一个doc类型中的用户。

这是存储它们的最佳方式,还是应该为每个类别创建一个新的doc类型(类别可以根据主题标签和推文内容来决定)

存储此类数据的最佳方法是什么?

提前致谢。

1 个答案:

答案 0 :(得分:1)

首先,您的问题的答案是,这在很大程度上取决于您的用例。你的申请在做什么?你怎么处理这些推文?你打算有多少个类别?

但是,一般情况下,我会针对所有推文使用相同索引和相同doc_type的解决方案。这允许您在所有推文上构建查询和聚合,而无需考虑不同类别的类别。它还允许您轻松添加新类别,而无需更改您的查询。

如果您想对推文进行一些分类,可以在存储在elasticsearch中的推文文档中添加一个类别字段。然后,您可以使用此类别字段来实现特定的应用程序逻辑。

如果您的类别名称包含空格或标点符号,请不要忘记将类别字段定义为not_analyzed。否则它将被分解。