如何打印日期超过两天的文本行

时间:2012-09-03 11:49:33

标签: awk

我有以下文本文件,我必须能够在creationdatetime超过两天时解析对象名称值。

objectname ...........................: \Path\to\file\hpvss-LUN-22May12 22.24.11\hpVSS-LUN-29Aug12 22.39.15
creationdatetime .....................: 01-Sep-2012 02:17:43
objectname ...........................: \Path\to\file\hpVSS-LUN-22May12 22.24.11\hpVSS-LUN-28Aug12 22.16.19
creationdatetime .....................: 03-Sep-2012 10:18:09
objectname ...........................: \Path\to\file\hpVSS-LUN-22May-12 22.24.11\hpVSS-LUN-27Aug12 22.01.52
creationdatetime .....................: 03-Sep-2012 10:18:33

上述命令的输出为:

\Path\to\file\hpvss-LUN-22May12 22.24.11\hpVSS-LUN-29Aug12 22.39.15

非常感谢任何帮助。

炳廷

2 个答案:

答案 0 :(得分:3)

awk中的日期解析有点棘手,但可以使用mktime完成。要将月份名称转换为数字,需要定义关联转换数组。

路径名中有空格,因此字段分隔符的最佳选择可能是:(冒号后跟空格)。这是一个有效的awk脚本:

<强> older_than_two_days.awk

BEGIN {
  months2num["Jan"] = 1;  months2num["Feb"] =  2; months2num["Mar"] =  3; months2num["Apr"] =  4;
  months2num["May"] = 5;  months2num["Jun"] =  6; months2num["Jul"] =  7; months2num["Aug"] =  8;
  months2num["Sep"] = 9;  months2num["Oct"] = 10; months2num["Nov"] = 11; months2num["Dec"] = 12;

  now = systime()
  two_days = 2 * 24 * 3600
  FS  = ": "
}

$1 ~ /objectname/ { 
  path = $2
}

$1 ~ /creationdatetime/ {
  split($2, ds, " ")
  split(ds[1], d, "-")
  split(ds[2], t, ":")
  date           = d[3] " " months2num[d[2]] " " d[1] " " t[1] " " t[2] " " t[3]
  age_in_seconds = mktime(date)

  if(now - age_in_seconds > two_days)
    print path
}

最后一个块中的所有拆分是挑选日期位并将其转换为mktime接受的格式。

像这样运行:

awk -f older_than_two_days.awk infile

输出:

\Path\to\file\hpvss-LUN-22May12 22.24.11\hpVSS-LUN-29Aug12 22.39.15

答案 1 :(得分:2)

我会分两个阶段完成:

1)重新格式化输入文件

awk '/objectname/{$1=$2="";file=$0;getline;$1=$2="";print $0" |"file}' inputfile > inputfile2

这样你就可以处理

01-Sep-2012 02:17:43 |  \Path\to\file\hpvss-LUN-22May12 22.24.11\hpVSS-LUN-29Aug12 22.39.15
03-Sep-2012 10:18:09 |  \Path\to\file\hpVSS-LUN-22May12 22.24.11\hpVSS-LUN-28Aug12 22.16.19
03-Sep-2012 10:18:33 |  \Path\to\file\hpVSS-LUN-22May-12 22.24.11\hpVSS-LUN-27Aug12 22.01.52

2)过滤日期:

COMPARDATE=$(($(date +%s)-2*24*3600)) # 2 days off
IFS='|'
while read d f
do 
  [[ $(date -d "$d" +%s) < $COMPARDATE ]] && printf "%s\n" "$f"
done < inputfile2