Unix中基于某些特定字符串的出现分割文件

时间:2018-09-12 13:40:44

标签: file unix file-processing

我的文件内容如下

Tenor|CurrentCoupon
15Y|3.091731898890382
30Y|3.5773546584901617
Id|Cusip|Ticker|Status|Error|AsOfDate|Price|LiborOas
1|01F020430|FN 15 2 F0|1||20180312|95.19140625|-0.551161358515
2|01F020448|FN 15 2 F1|1||20180312|95.06640625|1.18958768351
3|01F020547|FN 20 2 F0|1||20180312|90.484375|50.742896921
4|01F020554|FN 20 2 F1|1||20180312|90.359375|52.4642397071
5|01F020646|FN 30 2 F0|1||20180312|90.25|6.26649840403

我必须将其拆分为2个文件,例如

Tenor,CurrentCoupon
15Y,3.294202313
30Y,3.727696014

Id,Cusip,Ticker,Status,Error,AsOfDate,Price,LiborOas
1,01F020489,FN 15 2 F0,1,,20180807,94.27734375,6.199343069
2,01F020497,FN 15 2 F1,1,,20180807,94.15234375,8.225144379
3,01F020588,FN 20 2 F0,1,,20180807,89.984375,48.11248894

我对UNIX脚本知之甚少。行数会有所不同。

1 个答案:

答案 0 :(得分:1)

使用awk,您可以做一些非常简单的事情

awk -F '|' '{print $0 > NF ".txt"}' yourfile.txt

此命令会将文件拆分为2.txt(所有行均包含2列)和8.txt(所有行均包含8列)

要理解此命令,-F选项设置定界符,awk将逐行解析文件,$ 0代表整行,NF代表解析行中的字段数。

如果要从|更改定界符到,:

awk -F '|' 'BEGIN{OFS=","};{$1=$1; print > NF ".txt"}' yourfile.txt

OFS代表输出文件分隔符,$ 1 = $ 1是用正确的分隔符^^

重建行的丑陋技巧。