我有一个包含数百万条记录的数据库。
该表有两个属性1]名称2]位置
有许多记录具有不同的名称但位置相同,那么是否有可以应用于位置属性的压缩技术?
您可以使用支持的数据库名称建议各种无损压缩技术。
答案 0 :(得分:4)
Normalise your database。有一个LOCATIONS
表,并为你的第一个表提供一个外键。
少于65,535个不同的地点?这是原始表中每个记录的两个字节。如果你问我,压缩会很好。还可以使索引和比较更快。
数据比代码更重要。首先获取数据。 默认情况下尽可能正常化。只有在您发现(特定的,测量的,完全归因的)性能问题或一些重大原因之后才会反规范化。
答案 1 :(得分:0)
您想要查找空间索引。 A si将2d复杂度降低到1d复杂度。 Si用于热图和树图。它看起来像一个四叉树。