我想知道在弹性搜索中为索引设计数据模型时的最佳实践。我们有一个系统,我们需要从云存储系统(例如:dropbox),社交媒体(例如:twitter),网络文章等中提取数据。
我们面临的设计问题是每种类型的文档都有不同的字段/映射。
我探索过的一些选项。
在单个索引下使用不同的类型,因为它具有不同的doc结构(例如:弹性类型facebook,twitter,drobpox,googledrive等)。这将倾向于在索引下添加许多类型。
使用index的动态映射可在必要时添加字段。并为所有文档使用相同的映射。在这种情况下,大多数字段将为空。(例如:对于存储社交媒体特定字段的弹性文档将为空)。
对不同的数据点使用不同的索引。在这种情况下,会有很多指数。
我想知道哪些选项在我们的用例中最好。我的考虑是搜索和索引性能和可伸缩性。任何帮助将不胜感激。