我们是一家为运输和物流公司提供服务的物联网公司。作为基础设施服务提供商,我们为客户提供GPS跟踪设备。
虽然GPS跟踪数据的格式非常整洁(gpsId,经度,纬度,速度,方向,报告时间等),但它的数量非常大。每台设备每10秒报告一次GPS跟踪信息,我们有100k设备,因此每天产生60 * 60 * 24 * 100000/10 = 864M行新数据。
使用特定车辆的GPS追踪装置收集的数据,客户可以在给定时间内查看该车辆的痕迹(例如,过去10天,需要60 * 60 * 24 * 10/10 = 86.4 K行数据)。
目前我们使用MySQL作为存储介质,并利用它的分片和表分区(基于gpsId)。但由于数据太大而且查询频繁,所以我想知道我们是否可以使用NoSQL存储来更好地适应这种情况?
历史数据对数据分析也很有用。
赞赏。
答案 0 :(得分:1)
听起来你想要一个时间序列数据库。这些数据库针对按时间索引的大型数字数组进行了优化。维基百科列出了几个时间序列的开源和专有数据库,其中包括几个建立在Cassandra之上的数据库。
答案 1 :(得分:0)