以下是我的文字文件的摘录
namq_aux_lp 4 Last update of data 07.07.2014 t
namq_aux_ulc 4 Last update of data 08.07.2014
namq_aux_gph 4 Last update of data 07.07.2014
prc_hicp_cann 4 Last update of data 17.07.2014
namq_nace10_k 4 Last update of data 02.07.2014 clas
sei_bsco_m 4 Last update of data 10.06.2014
ei_bsin_m_r2 4 Last update of data 26.06.2014
lassei_bsbu_m_r2 4 Last update of data 26.06.2014
assei_bsrt_m_r2 4 Last update of data 26.06.2014 t
ei_bssi_m_r2 4 Last update of data 26.06.2014 t
ei_bsse_m_r2 4 Last update of data 26.06.2014
ei_bsci_m_r2 4 Last update of data 26.06.2014
10 sts_trtu_m 4 Last update of data 17.07.2014 c
我正在尝试格式化并清理它,将其保留为第一列和日期。但是你可以看到,最后一行有10个。我无法删除它,因为如果我这样做,sei_bsco_m
的日期将被截断。
任何帮助都将不胜感激。
注意代码在这里https://ideone.com/JbuRHK
所需的输出将是:
namq_aux_lp 07.07.2014
namq_aux_ulc 08.07.2014
...
assei_bsrt_m_r2 26.06.2014
...
答案 0 :(得分:2)
只需查看第7个字段中每行的第一个日期,然后打印第6个字段:
$ awk '{
for (i=7;i<=NF;i++)
if ($i ~ /^([[:digit:]]{2}\.){2}[[:digit:]]{4}$/) {
printf "%-20s%10s\n", $(i-6), $i
next
}
}' file
namq_aux_lp 07.07.2014
namq_aux_ulc 08.07.2014
namq_aux_gph 07.07.2014
prc_hicp_cann 17.07.2014
namq_nace10_k 02.07.2014
sei_bsco_m 10.06.2014
ei_bsin_m_r2 26.06.2014
lassei_bsbu_m_r2 26.06.2014
assei_bsrt_m_r2 26.06.2014
ei_bssi_m_r2 26.06.2014
ei_bsse_m_r2 26.06.2014
ei_bsci_m_r2 26.06.2014
sts_trtu_m 17.07.2014
以上并不关心您可能拥有多少个前导或尾随不受欢迎的字段,或者这些字段可能包含的内容,只要您没有7个前导不合需要的字段,第7个字段是日期!
或者,这只是打印字符串“4 Last update of data”的每一行的第一个:
$ awk -F'[[:space:]]+[[:digit:]]+ Last update of data[[:space:]]+' '{
sub(/.*[[:space:]]/,"",$1)
sub(/[[:space:]].*$/,"",$2)
printf "%-20s%10s\n", $1, $2
}' file
namq_aux_lp 07.07.2014
namq_aux_ulc 08.07.2014
namq_aux_gph 07.07.2014
prc_hicp_cann 17.07.2014
namq_nace10_k 02.07.2014
sei_bsco_m 10.06.2014
ei_bsin_m_r2 26.06.2014
lassei_bsbu_m_r2 26.06.2014
assei_bsrt_m_r2 26.06.2014
ei_bssi_m_r2 26.06.2014
ei_bsse_m_r2 26.06.2014
ei_bsci_m_r2 26.06.2014
sts_trtu_m 17.07.2014
答案 1 :(得分:1)
以下是一些可行的方法:
awk '/^10/ {$1=""}1' file | column -t
namq_aux_lp 4 Last update of data 07.07.2014 t
namq_aux_ulc 4 Last update of data 08.07.2014
namq_aux_gph 4 Last update of data 07.07.2014
prc_hicp_cann 4 Last update of data 17.07.2014
namq_nace10_k 4 Last update of data 02.07.2014 clas
sei_bsco_m 4 Last update of data 10.06.2014
ei_bsin_m_r2 4 Last update of data 26.06.2014
lassei_bsbu_m_r2 4 Last update of data 26.06.2014
assei_bsrt_m_r2 4 Last update of data 26.06.2014 t
ei_bssi_m_r2 4 Last update of data 26.06.2014 t
ei_bsse_m_r2 4 Last update of data 26.06.2014
ei_bsci_m_r2 4 Last update of data 26.06.2014
sts_trtu_m 4 Last update of data 17.07.2014 c
或获得你的输出:
awk '/^10/ {$1=""}1' file | awk '{print $1,$7}' OFS="\t"
namq_aux_lp 07.07.2014
namq_aux_ulc 08.07.2014
namq_aux_gph 07.07.2014
prc_hicp_cann 17.07.2014
namq_nace10_k 02.07.2014
sei_bsco_m 10.06.2014
ei_bsin_m_r2 26.06.2014
lassei_bsbu_m_r2 26.06.2014
assei_bsrt_m_r2 26.06.2014
ei_bssi_m_r2 26.06.2014
ei_bsse_m_r2 26.06.2014
ei_bsci_m_r2 26.06.2014
sts_trtu_m 17.07.2014
或者像这样:
awk '/^10/ {$1=""}1' file | awk '{print $1,$7}' | column -t
namq_aux_lp 07.07.2014
namq_aux_ulc 08.07.2014
namq_aux_gph 07.07.2014
prc_hicp_cann 17.07.2014
namq_nace10_k 02.07.2014
sei_bsco_m 10.06.2014
ei_bsin_m_r2 26.06.2014
lassei_bsbu_m_r2 26.06.2014
assei_bsrt_m_r2 26.06.2014
ei_bssi_m_r2 26.06.2014
ei_bsse_m_r2 26.06.2014
ei_bsci_m_r2 26.06.2014
sts_trtu_m 17.07.2014
答案 2 :(得分:1)
您可以使用sed
和column
:
sed -nr 's|.*\b(\S+_\S+)\b.*\b([0-9]+[.][0-9]+[.][0-9]+)\b.*|\1\t\2|p' file | column -t
输出:
namq_aux_lp 07.07.2014
namq_aux_ulc 08.07.2014
namq_aux_gph 07.07.2014
prc_hicp_cann 17.07.2014
namq_nace10_k 02.07.2014
sei_bsco_m 10.06.2014
ei_bsin_m_r2 26.06.2014
lassei_bsbu_m_r2 26.06.2014
assei_bsrt_m_r2 26.06.2014
ei_bssi_m_r2 26.06.2014
ei_bsse_m_r2 26.06.2014
ei_bsci_m_r2 26.06.2014
sts_trtu_m 17.07.2014
注意:
_
。\S
可能无效,因此您也可以考虑使用[^[:space:]]
或[^ \t\r]
。答案 3 :(得分:0)
另一种解决方案可能如下:
- 删除前两个数字
- 删除空格
- 使用OFS(输出字段分隔符)
$ sed 's/^[0-9][0-9]//' telecharge.txt | sed 's/ //' | awk '{print $1,$7}' OFS='\t'
namq_aux_lp 07.07.2014
namq_aux_ulc 08.07.2014
namq_aux_gph 07.07.2014
prc_hicp_cann 17.07.2014
namq_nace10_k 02.07.2014
sei_bsco_m 10.06.2014
ei_bsin_m_r2 26.06.2014
lassei_bsbu_m_r2 26.06.2014
assei_bsrt_m_r2 26.06.2014
ei_bssi_m_r2 26.06.2014
ei_bsse_m_r2 26.06.2014
ei_bsci_m_r2 26.06.2014
sts_trtu_m 17.07.2014