我正在尝试找出存档日常内容的最佳方式 - 在本例中为分析。
每晚都会运行一个分析程序,按以下格式为一组指标创建信息的每日快照:
object_id INT
metric_id INT
score INT
我们创建一个新表,然后执行DELETE + RENAME交换它。工作完美。可以有10k到2MM的行。
新的担忧是,我们可能决定有一天不仅提供当前分数,而且随着时间的推移显示分数。 我们针对其他几组指标执行此操作,但它们是根据需要构建的 - 我们没有再次重新创建这些分数所需的原始数据。
我倾向于将所有内容存档在一个表中,如下所示:
object_id INT
metric_id INT
score INT
analytics_date DATE
我只是想知道是否有人之前遇到过这种需求,并且已经探索过使用多表格式来节省拥有DATE列的开销。
我并不关心WRITE的速度,因为这是一份批量工作。我主要关注的是磁盘空间和读取性能。