我陷入困境,
我可以选择进行这样的处理,使得它将输入一行到20个索引的表。
或者我可以创建一个表并在其中输入20行(以及在第一个表中输入单行)。在这种情况下,两个表都将具有单个索引。
我的第一个表(在两个场景中)都会收到大量的读/写。而第二个表(在第二个场景中)将获得大量写入和少量读取。
两者中哪一个会是更好的选择?
如果这个描述听起来太抽象,我会用实际情况更新问题。
答案 0 :(得分:0)
听起来你有一个来自平面文件的表,里面有重复的集合,你试图决定是否最好有一个进程来规范化数据以及保留原始数据的副本,或者只是以原始形式索引原始数据。
我会说你应该有规范化的表,因为这将简化在大平面表的每个列集上使用union all
的查询。这也可以消除null
或重复的列集。