我有一个包含超过100万以下字符串的文档,我喜欢通过提取一些部分创建一些新结构并为它创建一个csv文件,这是最快的方法吗?
document/0006-291X(85)91157-X
我想在每一行都有一个文件,其中包含原始字符串和提取的部分
document/0006-291X(85)91157-X;0006-291X;85
答案 0 :(得分:6)
你可以试试这个单行awk
:
awk -F "[/()]" -v OFS=';' '{print $0,$(NF-2),$(NF-1)}' your-file
它以/,(,)
作为分隔符来解析每一行的字段。然后它打印出整行,第3个字段和从行尾开始的第二个字段。选项-v OFS=';'
将semicolumns打印为输出字段分隔符。