对于Hadoop这件事我是新手。我要完成的工作是将时间序列数据通过云存储在分布式系统中。对我来说,在Web OpenTSDB上查看一些内容似乎是一个可行的选择。
我也有一些RDBMS数据库,这些数据库可以存储在分布式系统中,并可以通过配置单元使用。
我们计划要做的是使用时间序列数据库和结构化RDBMS数据(通过HIVE进行读取和写入),然后将时间序列数据与该结构化数据结合起来。存储输出,以便可以通过HIVE像SQL一样对它进行读写。
答案 0 :(得分:0)
不确定是否要询问Hadoop或TSDB。
如果您已经有Hadoop环境,那么当然可以添加HBase,然后添加OpenTSDB。
如果您想要提供更多以查询为中心的想法的替代方案,那么Influxdb或TimescaleDb在该领域似乎更受欢迎。
如果可扩展性确实是问题所在,那么带Kairos的Cassandra是另一个选择。
作为类似Hive的处理的一部分,SparkSQL可能可以与以上所有功能进行交互