Question

我有这样的事情：

  grep -v ">" $subfolder/assembly/contigs_1L.fasta | xargs -d \n wc   >> $subfolder/N50_analysis/NC_len.txt

我希望，从fasta文件中删除标识符，然后我想为每一行计算该行的字符。

xargs做了它应该做的事情，在\ n之后拆分，但它不会计算。如果我在没有\ n的情况下这样做，那么一切只有一条大线。

编辑：

输入

>C1
AGATGATGAGGATGAGATTGACTACGATCGATCGATGCATCGATCGGCATCGATCGACTGATCGATCGATCGATCGATCGATCGTACGATCGGCTACGCGCGATCGACGCGCGCGATCGATCGATCGTCGATCGGCGCGCTACGATCG

>C2
AGATGATGAGGATGAGATTGACTACGATCGATCGATGCATCGATCGGCATCGATCGACTGATCGATCGATCGATCGATCGATCGTACGATCGGCTACGCGCGATCGACGCGCGCGATCGATCGATCGTCGATCGGCGCGCTACGATCG

我只需要AGCT序列的长度，所以我在文件中接受（grep）所有不以＆gt;开头的内容。然后我想独立计算每个序列的长度，所以最后我得到这样的东西：

Answer 1

grep -v ">" testfile | awk '{ print length }' >> charcount.txt

可能就是你要找的东西。

Xargs和wc -c

1 个答案: