我想为我的服务器制作一个系统监控应用程序,它每分钟收集超过30k个数据点,用于各种应用程序,如mysql,memcached,apache等。我想知道哪个平台最适合用于这样的应用程序。我的主要选择是HBase和Cassandra。
如果我必须使用HBase,那么查询的行键应该是必须回答特定ip或主机名或运行特定应用程序或特定数据中心或特定群集的所有机器的问题。鉴于所有参数在相当长的一段时间内是变化的,并且识别特定机器的唯一方法是其UUID。此外,没有必要基于uuid查询,但它的ip或应用程序类型和应用程序和进程。
由于查询汇总并在hbase中向下钻取查询并不容易,因此在cassandra中很容易。在设计这样一个系统时,我的偏好应该是什么。还可以选择哪些其他平台?
还请指定此类系统的设计规范和数据模式应该是什么