awk与1970年以前的日期

时间:2015-04-09 15:15:58

标签: bash date awk

来自https://www.gnu.org/software/gawk/manual/html_node/Time-Functions.html

我知道gawk只有2个函数可以处理日期/时间 mktimestrftime

所以,我可以使用返回long的mktime解析任何日期,所以我可以进行任何数学运算,因此我可以使用strftime格式化所需的输出

这就像"1970 01 01 00 00 00"

之后的任何日期的魅力一样

使用awk,如何在1970年之前格式化日期?

$ awk 'BEGIN{t=mktime("1970 01 01 00 00 00"); print t; print strftime("%Y-%m-%d", t) }'
10800
1970-01-01
$ awk 'BEGIN{t=mktime("1960 01 01 00 00 00"); print t; print strftime("%Y-%m-%d", t) }'
-315608400
awk: cmd. line:1: (FILENAME=- FNR=1) fatal: strftime: second argument less than 0 or too big for time_t

2 个答案:

答案 0 :(得分:2)

不幸的是,正如你所见,gawk不能直接这样做。 gawk manual说:

  

所有已知的符合POSIX标准的系统都支持0到2 ^ 31 - 1的时间戳,这足以表示2038-01-19 03:14:07 UTC的时间。许多系统支持更广泛的时间戳,包括表示纪元之前的时间的负时间戳。

如果给出超出范围的日期,手册并没有说明strftime()的作用。

但是即使在我的系统上,gawk的time_t函数确实对负strftime()值有明显的行为,但它并不支持它们(尽管mktime()会这样做),所以不能在1970年之前处理日期。我认为这是一个gawk中的错误。

(我的建议是使用Perl代替Awk,但这并不能回答您提出的问题。)

原则上,您可以通过在awk中重新实现strftime()之类的函数来重新发明轮子。但这太过分了。

如果您的系统具有可用的GNU coreutils date命令,则可以从gawk调用它。用你1960年1月1日的例子:

$ cat 1960.awk
#!/usr/bin/awk -f

BEGIN {
    timestamp = mktime("1960 00 00 00 00 00")
    print "mktime() returned " timestamp

    if (0) {
        # This doesn't work
        s = strftime("%Y-%m-%d %H:%M:%S", timestamp)
        print "strftime() returned ", s
    }
    else {
        # This works
        "date '+%Y-%m-%d %H:%M:%S' -d @" timestamp | getline t
        print "The date command printed \"" t "\""
    }
}
$ ./1960.awk
mktime() returned -318355200
The date command printed "1959-11-30 00:00:00"
$

(我放弃了从shell提示符中找出作为单行所需的引号和反斜杠序列。)

如果你有一个庞大的现有awk程序并且你需要添加这个功能,这可能是有意义的。但是如果你不坚持用awk这样做,你可能会考虑使用别的东西; awk可能不是你正在努力完成的工具。

或者,如果您真的雄心勃勃,可以修改gawk来源以正确处理此案例。

答案 1 :(得分:2)

所以,这是一个错误......

我正在使用GNU awk 4.0.2,对源代码的看法很容易解决:

glaudiston:/sources/gawk-4.0.2$ diff builtin.c.orig builtin.c
1701,1702c1701,1702
<                       if (clock_val < 0)
<                               fatal(_("strftime: second argument less than 0 or too big for time_t"));
---
>                       // if (clock_val < 0)
>                       //      fatal(_("strftime: second argument less than 0 or too big for time_t"));
glaudiston:/sources/gawk-4.0.2$ echo "" | ./gawk '{ts="1969 12 31 23 00 00";format="%Y/%m/%d";tv=mktime(ts);print tv;print strftime(format, tv)}'
7200
1969/12/31
glaudiston:/sources/gawk-4.0.2$ echo "" | ./gawk '{ts="1960 01 01 00 00 00";format="%Y/%m/%d";tv=mktime(ts);print tv;print strftime(format, tv)}'
-315608400
1960/01/01

为了我的目的,它有效,但我不确定这是不是一个好主意。我会把它发给gawk maillist批准。

讨论开始于: https://lists.gnu.org/archive/html/bug-gawk/2015-04/msg00012.html

解决方案更新:

awk开发团队修复了这个bug,所以只需将你的awk升级到新版本:

https://lists.gnu.org/archive/html/bug-gawk/2015-04/msg00036.html