以一种模式排列给定的线条

时间:2013-12-17 05:20:24

标签: regex perl python-2.7 biopython

我有很多文件包含有关人类的信息。 每个文件中的信息模式是:

587. JARID2 antisense RNA 1
JARID2-AS1, Homo sapiens
Hs.664092: 16 sequences.

588. Transcribed locus
Homo sapiens
Hs.569392: 11 sequences.

589. Golgin A8 family, member G
GOLGA8G, Homo sapiens
Hs.169639: 11 sequences.

但我想让它们像那样(标签分开):

587. JARID2 antisense RNA 1 JARID2-AS1, Homo sapiens    Hs.664092: 16 sequences.

588. Transcribed locus  Homo sapiens    Hs.569392: 11 sequences.

589. Golgin A8 family, member G GOLGA8G, Homo sapiens   Hs.169639: 11 sequences.

这样我就可以把它们放到xl文件中,手动安排需要花费很多时间。

2 个答案:

答案 0 :(得分:1)

使用perl oneliner:

perl -00 -wlpe 's/\n//gms' file.txt

或者如果你真的想要分页

perl -00 -wlpe 's/\n/\t/gms' file.txt

答案 1 :(得分:0)

将此模式([^\r\n])[\r\n]([^\r\n])g选项一起使用 并替换w $1 $2 Demo