目前我正在开发一个数据库,要求我从第三方获取原始数据并将其存储到数据库中。问题是原始数据显然没有优化,而我正在构建数据库的人不希望在将原始数据上传到数据库时涉及任何数据输入,他们几乎只想上传数据并完成它。一些原始数据文件在整个地方都有空单元格,并且有许多重复名称/数字/条目的实例。有没有办法在没有太多数据输入的情况下快速有效地优化数据或每次上传数据时进行重新处理,或者这是因为约束而无法进行优化的瞬间?这是否会发生很多,或者我是否需要告诉他们他们上传的梦想不可能让团队长期成功?
答案 0 :(得分:1)
有很多方法可以优化数据,在一个用例中优化数据的一种方法在另一个用例中可能很糟糕。有些工具会告诉您需要优化的列中有多个值,但没有一个建议适用于所有情况。
没有具体细节,这总是好的:
我的建议是考虑您的架构,但不要尝试过度优化,因为您无法提前计划具体用途。只要它工作且没有瓶颈,就要关注其他领域。如果存在瓶颈,那么一定要重写受影响的部分,确保存在索引(在某些情况下考虑复合索引)。考虑尽可能避免使用工会。并记住KISS原则(保持简单和甜蜜)。