每月获取第一个和最后一个文件

时间:2012-04-22 10:56:10

标签: linux bash sed awk

基于此问题Group files and pipe to awk command

我有一组这样的文件: -

-rw-r--r-- 1 root root 497186 Apr 21 13:17 2012_03_25
-rw-r--r-- 1 root root 490558 Apr 21 13:17 2012_03_26
-rw-r--r-- 1 root root 488797 Apr 21 13:17 2012_03_27
-rw-r--r-- 1 root root 316290 Apr 21 13:17 2012_03_28
-rw-r--r-- 1 root root 490081 Apr 21 13:17 2012_03_29
-rw-r--r-- 1 root root 486621 Apr 21 13:17 2012_03_30
-rw-r--r-- 1 root root 490904 Apr 21 13:17 2012_03_31
-rw-r--r-- 1 root root 491788 Apr 21 13:17 2012_04_01
-rw-r--r-- 1 root root 488630 Apr 21 13:17 2012_04_02

基于链接问题的答案,我有一个脚本,代码如下: -

DIR="/tmp/tmp"
for month in $(find "$DIR" -maxdepth 1 -type f | sed 's/.*\/\([0-9]\{4\}_[0-9]\{2\}\).*/\1/' | sort -u); do
  echo "Start awk command for files $month"
  power=$(awk -F, '{ x += $1 } END { print x/NR }' "$DIR/${month}"_[0-3][0-9])
  echo $power
done

下面的命令就可以返回如下列表: -

find /tmp/tmp -maxdepth 1 -type f | sed 's/.*\/\([0-9]\{4\}_[0-9]\{2\}\).*/\1/' | sort -u

2011_05
2011_06
2011_07
2011_08
2011_09
2011_10
2011_11
2011_12
2012_01
2012_02
2012_03
2012_04

find命令使用GLOB将一组文件传递给AWK,以便批量处理。

基于此,我希望能够运行以下剪切命令

head -1 FirstFile | date -d "`cut -d, -f7`" +%s

tail -1 LastFile | date -d "`cut -d, -f7`" +%s

需要为FIRST和LAST文件PER SET

运行这些

因此,对于上面的2012_03,需要为2012_03_25文件运行头部,并且需要为2012_03_31运行尾部,因为这些是3月集合中的第一个和最后一个文件。

所以基本上我需要能够获得第一个和最后一个文件PER BATCH。

我希望我已经说清楚了,如果不是,请发表评论。

1 个答案:

答案 0 :(得分:2)

DIR="/tmp/tmp"
for month in $(find "$DIR" -maxdepth 1 -type f | sed 's/.*\/\([0-9]\{4\}_[0-9]\{2\}\).*/\1/' | sort -u); do
      echo "Start awk command for files $month"
      IFS=, read start end power < <(awk -F, 'BEGIN{OFS = ","} NR == 1 {printf "%s,", $7} { x += $1; d = $7 } END { print d, x/NR }' "$DIR/${month}"_[0-3][0-9])
      echo $power
      date -d "$start" +%s
      date -d "$end" +%s
done

以下是如何使用here-doc,它应该适用于大多数shell:

      read start end power <<EOF
$(awk -F, 'NR == 1 {printf "%s ", $7} { x += $1; d = $7 } END { print d, x/NR }' "$DIR/${month}"_[0-3][0-9]))
EOF