我正在开发一个应用程序,它可以存储大量非常大的时间/值数据集(图表数据,基本上每天从传感器获取的值,一年中每小时或15分钟+)。目前我们将它们存储在2个MySQL表中:数据集表存储数据集的信息(ID,名称等),以及包含(数据集ID,时间戳,值)三元组的表。第二个表已经超过一百万行,预计要存储的数据量会大很多倍。
诸如检索范围内特定数据集的所有点的常见操作运行得足够快,但其他一些更复杂的操作可能会很痛苦。
这是组织数据的最佳方式吗?关系数据库是否特别适合这类事情?或者我只是需要学习定义更好的索引并优化查询?
答案 0 :(得分:1)
关系数据库绝对是这种大型结构化数据集所需要的。如果单个查询导致问题,则值得对每个查询进行分析,以确定是否需要不同的索引或其他。