假设我有两个索引,分别是从MySQL表创建的。
folder: folder_id, resume_id, status
resume: resume_id, title, skills, experience etc...
我希望在resume_id
的基础上需要JOIN的数据很少。如果需要,我们可以在指数中设置自动增量字段。
据我说,我可以选择的选项是:
1. 索引合并:我不想合并索引,因为它会占用很多空间。我有数十亿的数据。
2. 加入表格后创建一个索引。此解决方案的问题在于,文件夹有许多简历,一个简历可以在许多其他文件夹中(多对多)。因此,同一个简历的数据将被多次索引,从而引发数据冗余。
如果可能,请在sphinx中建议一种方法,以实现这一目标,同时保持性能并减少数据冗余。我必须在具有数十亿数据的生产环境中使用它。在此先感谢:)
答案 0 :(得分:0)
您可以在脚本代码中进行虚拟连接(例如,PHP)。性能不会受到影响,您不必合并索引。
另一种方法是根据附加条件创建一个索引(你说你想要“少量”数据,这意味着必须有一个附加条件)。