我们在数据仓库解决方案中广泛使用HIVE。许多预定作业和临时查询正在访问这些。我怎样才能找到我公司最受欢迎的HIVE表。
这样我就可以采取一些措施来改善它。
答案 0 :(得分:0)
您还没有提到您正在运行Hive的Hadoop分发,但如果是Cloudera,您可以查看Cloudera Navigator Optimizer:
配置SQL工作负载以获得跨多个维度的可见性,包括:
https://www.cloudera.com/documentation/navopt/topics/EvaluatingHiveImpalaWorkloads.html
用例:按CPU时间,内存使用情况和文件评估查询集 系统读/写
即使没有Cloudera Navigator Optimizer,只有Cloudera Navigator,我猜你可以从Navigator的Solr后端数据库中获得类似的数据。
我不知道任何其他提供类似功能的产品(我不隶属于Cloudera,但将其产品用作客户端)。