我需要找出每个模式中创建的表的数量,并找出每个模式占用的大小。
答案 0 :(得分:1)
可以使用shell脚本
计算命令输出中的行hive -S -e "set hive.cli.print.header=false; use $schema; show tables;" | wc -l
其中$ schema是您的模式名称
架构的大小有点棘手。模式中的每个表都可以在HDFS中拥有自己的位置,该位置与模式默认位置不同。您需要遍历模式表(请参阅上一个命令),describe formatted each table
,解析表位置,获取位置大小并汇总HDFS中的所有表位置大小。
要获取表位置大小,请使用以下命令:
hdfs hadoop fs -du [table location]
。