我想使用unix脚本转置文本文件的行和列。 有人可以建议工作吗?
输入文件:INPUT.txt
DM_AG_POSN_FDIC_BASE 22-MAY-2017 02:56:00 03:15:46 00:19:46
DM_AG_POSN_FDIC_BASE 23-MAY-2017 03:26:47 03:45:33 00:18:46
DM_EC_CONS_POSN_BASE_HELPER 22-MAY-2017 03:06:43 03:08:38 00:01:55
DM_EC_POSN_B3_ENRICHED 22-MAY-2017 03:08:43 03:23:14 00:14:31
DM_EC_POSN_B3_PRORATED 22-MAY-2017 03:23:27 03:30:07 00:06:40
DM_EC_CONS_POSN_BASE_HELPER 23-MAY-2017 03:36:21 03:38:10 00:01:49
DM_EC_POSN_B3_ENRICHED 23-MAY-2017 03:38:23 04:00:08 00:21:44
DM_EC_POSN_B3_PRORATED 23-MAY-2017 04:00:08 04:06:30 00:06:21
必需的输出文件是:
DM_AG_POSN_FDIC_BASE DM_EC_CONS_POSN_BASE_HELPER DM_EC_POSN_B3_ENRICHED DM_EC_POSN_B3_PRORATED
22-MAY-2017 02:56:00 03:15:46 00:19:46 22-MAY-2017 03:06:43 03:08:38 00:01:55 22-MAY-2017 03:08:43 03:23:14 00:14:31 22-MAY-2017 03:23:27 03:30:07 00:06:40
23-MAY-2017 03:26:47 03:45:33 00:18:46 23-MAY-2017 03:36:21 03:38:10 00:01:49 23-MAY-2017 03:38:23 04:00:08 00:21:44 23-MAY-2017 04:00:08 04:06:30 00:06:21
注意:行数不是常量,但INPUT.txt文件的第一列名称始终是常量。
感谢您的建议/解决方法!
实施了该群组中某个活跃成员建议的代码。
sed 's/ \+/|/g;s/ $//' file |
awk -F '|' '{x=$1;$1="";a[x]=a[x]"|" substr($0, 2)} END{for(i in a) print i a[i]}' |
awk -F '|' '{for (i=1; i<=NF; i++) a[i,NR]=$i; max=(max<NF?NF:max)} END {for (i=1; i<=max; i++) {for (j=1; j<=NR; j++) printf "%s%s", a[i,j], (j<NR?"|":ORS) }}' |
column -t -s '|'
我得到的输出如下:
DM_AG_POSN_FDIC_BASE
22-MAY-2017 02:56:00
-BLANK- --> There is no output from 2nd line onwards(tried for only one record). Could you please check this ?
答案 0 :(得分:1)
这是一个对输入数据脆弱的。 sort
对记录进行分组,Awk将$ 1和其余记录拆分为不同的行,rs
用于将其转换为具有漂亮输出的3行:
$ awk '{if(p!=$1)print $1;p=$1;sub(p,"",$0);$1=$1}1' <(sort file) | rs -e -t 3
DM_AG_POSN_FDIC_BASE DM_EC_CONS_POSN_BASE_HELPER DM_EC_POSN_B3_ENRICHED DM_EC_POSN_B3_PRORATED
22-MAY-2017 02:56:00 03:15:46 00:19:46 22-MAY-2017 03:06:43 03:08:38 00:01:55 22-MAY-2017 03:08:43 03:23:14 00:14:31 22-MAY-2017 03:23:27 03:30:07 00:06:40
23-MAY-2017 03:26:47 03:45:33 00:18:46 23-MAY-2017 03:36:21 03:38:10 00:01:49 23-MAY-2017 03:38:23 04:00:08 00:21:44 23-MAY-2017 04:00:08 04:06:30 00:06:21
每个标题项预计会有两行数据,如示例数据中所示。如果不是这种情况,请更新数据以更好地反映实际情况。