Question

我有一个包含超过100万以下字符串的文档，我喜欢通过提取一些部分创建一些新结构并为它创建一个csv文件，这是最快的方法吗？

document/0006-291X(85)91157-X

我想在每一行都有一个文件，其中包含原始字符串和提取的部分

document/0006-291X(85)91157-X;0006-291X;85

Answer 1

你可以试试这个单行awk：

awk -F "[/()]" -v OFS=';' '{print $0,$(NF-2),$(NF-1)}' your-file

它以/,(,)作为分隔符来解析每一行的字段。然后它打印出整行，第3个字段和从行尾开始的第二个字段。选项-v OFS=';'将semicolumns打印为输出字段分隔符。