Question

我遇到了一个小问题而无法解决问题，

我有一个文件，其中包含以下几行：

fig|1671.3.peg.2935,fig|1671.3.peg.2936,fig|1671.3.peg.29370 operon1

我想要这样的事情：

fig|1671.3.peg.2935    operon1
fig|1671.3.peg.2936    operon1
fig|1671.3.peg.29370    operon1

该文件没有固定数量的逗号分隔元素，在本例中为3，其他情况有时为1到8。

提前致谢。 CS

Answer 1

使用此：

awk -F'[, ]' '{for(i=1;i<NF;i++) {print $i,$NF}}' <filename>

您可以将正则表达式指定为分隔符。 -F '[, ]告诉awk，,或（空格）可以是分隔符。其余的很明显。 NF是字段数，$NF是最后一个字段。

Answer 2

$ awk '{split($1, a, ","); for (i in a) {print a[i], $2}}' file
fig|1671.3.peg.2935 operon1
fig|1671.3.peg.2936 operon1
fig|1671.3.peg.29370 operon1

请注意，它适用于任意数量的逗号分隔字段：

$ cat file
hello,how,are,you good!
$ awk '{split($1, a, ","); for (i in a) {print a[i], $2}}' file
hello good!
how good!
are good!
you good!

Answer 3

此脚本应该按您的要求执行：

$ awk -F '[, ]+' '{for (i=1;i<NF;i++) print $i, $NF}' file
fig|1671.3.peg.2935 operon1
fig|1671.3.peg.2936 operon1
fig|1671.3.peg.29370 operon1

Answer 4

这可能适合你（GNU sed）：

sed -r 's/,(.*\s(\S+))/ \2\n\1/;P;D' file

在每一行上用空格替换,，然后用行后面的最后一个字符串替换换行符和行的其余部分。打印然后删除最多并包括引入的换行符并重复，直到找不到,为止。

Answer 5

awk版本，没有循环。

awk '{gsub(/,/," "$2"\n")}1' file
fig|1671.3.peg.2935 operon1
fig|1671.3.peg.2936 operon1
fig|1671.3.peg.29370 operon1