如何从配置单元日志文件中提取信息?

时间:2020-01-14 15:21:27

标签: logging hive

我想尽可能多地了解运行情况,以便找到瓶颈,并预测长时间运行的脚本何时可以完成:

到目前为止,我有以下脚本可以标识以下内容

what tables have been created
how many rows are in each table
how long each operation took

这是我想出的解决方案,有谁能做得更好?

alias tableCreate="grep 'INFO  : Table\|seconds' \$logfile  | grep -A1 Table --no-group-separator | cut -d' ' -f4,5,8 | paste -s -d' \n' | awk '{ printf \"%s %-60s %20s %12s %s\n\", \$1, \$2, \$3, \$4, \$5 }'"

以下是输出示例:

Table bi_ngx_prod_enc.featuresextract_daily_copy                   numRows=35215299285,      (496.99 seconds)
Table bi_ngx_prod_enc.featuresextract_curr                            numRows=67555686,      (855.35 seconds)
Table bi_ngx_prod_enc.ps_feature_insert_hx                             numRows=3393098,     (309.263 seconds)
Table bi_ngx_prod_enc.ps_feature_delete_hx                              numRows=612539,        (21.3 seconds)

从日志中我们还能得到什么有用的东西?

我想我也应该共享这个别名,该别名将logfile变量设置为log目录中最后更新的文件,然后在同一文件的末尾

alias lastlog='tail $(ls -tr logs/* | tail -1) ; ls -tr logs/* | tail -1; logfile=$(ls -tr logs/* | tail -1)'

0 个答案:

没有答案