Question

我将有一个包含几百万个条目的表格，我一直想知道创建的不仅仅是这一个表是否更聪明，即使它们都具有相同的结构？它会节省资源，最终会更有效吗？

这是我特别关注的问题，因为我计划创建一个小型搜索引擎，为大约3.000.000个站点编制索引，每个站点将有大约30个被索引的单词。这是我现在的结构

site
--id
--url

word
--id
--word

appearances
--site_id
--word_id
--score

我应该保留这种结构吗？或者我应该为A单词，B单词，C单词等创建表格？与外观表相同

Answer 1

在较小的表上选择查询会更快。您希望将必须排序的索引放入系统内存中以获得更好的性能更重要的是，不应定义表以保存某种类型的数据，而是定义相关数据的集合。因此，如果您存储的数据存在逻辑差异，则可能应将它们分成不同的表格。

（不完全）

优点：

缺点：

如果您不关心数据库的某些延迟，它应该能够在几百万条记录中处理这个问题，而不会有太多麻烦。

Answer 2

以下是一些问题要问自己：

有很多方法可以解决这个问题，但在你知道你正在使用的参数之前，很难说。

通常，第一步是收集大量真实数据，或者至少模拟与真实数据相当类似的足够数据，使其在结构上相同。然后使用测试数据尝试不同的存储和检索方法。

没有任何测试数据，你只是在黑暗中刺伤