Question

第5列和第17列中的字段合并在一起，我想拆分合并后的字段并放入单独的字段中。我的数据看起来像这样

326502010-12-10       320100807
368902010-12-14       420100716

但我希望看到这样的

32650       2010-12-10    3   20100807
36890       2010-12-14    4   20100716

Answer 1

使用awk，

$ awk -vOFS="\t" '{sub(/.{5}/, "&\t", $1); sub(/./, "&\t", $2)}1' file
32650   2010-12-10  3   20100807
36890   2010-12-14  4   20100716

Answer 2

如果日期之前的数字长度不同，请使用：

$ awk '{sub(/....-..-../,"\t&",$1); sub(/^./,"&\t",$2)} 1' file
32650   2010-12-10 3    20100807
36890   2010-12-14 4    20100716

sub用标签（\t）和匹配的部分（&）替换日期部分。日期。与$2的后一部分大致相同。

Answer 3

最好使用sed按字符分割：

$ sed -r 's/^(.{5})(.{18})/\1\t\2\t/' file
32650   2010-12-10       3  20100807
36890   2010-12-14       4  20100716

这会捕获给定的字符并将它们打印回来，并在它们之间添加一个标签。

Answer 4

您也可以使用cut：

$ cut --output-delimiter=$'\t' -c 1-5,6-17,18- file
32650   2010-12-10      3   20100807
36890   2010-12-14      4   20100716

使用-c选项，您可以设置一个列表，表示要剪切的行部分。逗号,已替换为设置为标签的--output-delimiter。