Xargs和wc -c

时间:2015-12-08 11:05:31

标签: xargs

我有这样的事情:

  grep -v ">" $subfolder/assembly/contigs_1L.fasta | xargs -d \n wc   >> $subfolder/N50_analysis/NC_len.txt

我希望,从fasta文件中删除标识符,然后我想为每一行计算该行的字符。

xargs做了它应该做的事情,在\ n之后拆分,但它不会计算。如果我在没有\ n的情况下这样做,那么一切只有一条大线。

编辑:

输入

>C1
AGATGATGAGGATGAGATTGACTACGATCGATCGATGCATCGATCGGCATCGATCGACTGATCGATCGATCGATCGATCGATCGTACGATCGGCTACGCGCGATCGACGCGCGCGATCGATCGATCGTCGATCGGCGCGCTACGATCG

>C2
AGATGATGAGGATGAGATTGACTACGATCGATCGATGCATCGATCGGCATCGATCGACTGATCGATCGATCGATCGATCGATCGTACGATCGGCTACGCGCGATCGACGCGCGCGATCGATCGATCGTCGATCGGCGCGCTACGATCG

我只需要AGCT序列的长度,所以我在文件中接受(grep)所有不以>开头的内容。然后我想独立计算每个序列的长度,所以最后我得到这样的东西:

 150
 100
  .
  .
  .
  Cn

1 个答案:

答案 0 :(得分:0)

grep -v ">" testfile | awk '{ print length }' >> charcount.txt

可能就是你要找的东西。