Question

假设我有两个索引，分别是从MySQL表创建的。

folder: folder_id, resume_id, status 
resume: resume_id, title, skills, experience etc...

我希望在resume_id的基础上需要JOIN的数据很少。如果需要，我们可以在指数中设置自动增量字段。

据我说，我可以选择的选项是：
1. 索引合并：我不想合并索引，因为它会占用很多空间。我有数十亿的数据。 2. 加入表格后创建一个索引。此解决方案的问题在于，文件夹有许多简历，一个简历可以在许多其他文件夹中（多对多）。因此，同一个简历的数据将被多次索引，从而引发数据冗余。

如果可能，请在sphinx中建议一种方法，以实现这一目标，同时保持性能并减少数据冗余。我必须在具有数十亿数据的生产环境中使用它。在此先感谢：）

Answer 1

您可以在脚本代码中进行虚拟连接（例如，PHP）。性能不会受到影响，您不必合并索引。

另一种方法是根据附加条件创建一个索引（你说你想要“少量”数据，这意味着必须有一个附加条件）。

如何在Sphinx中加入两个索引，（没有索引合并）？

1 个答案: