我有这样的事情:
grep -v ">" $subfolder/assembly/contigs_1L.fasta | xargs -d \n wc >> $subfolder/N50_analysis/NC_len.txt
我希望,从fasta文件中删除标识符,然后我想为每一行计算该行的字符。
xargs做了它应该做的事情,在\ n之后拆分,但它不会计算。如果我在没有\ n的情况下这样做,那么一切只有一条大线。
编辑:
输入
>C1
AGATGATGAGGATGAGATTGACTACGATCGATCGATGCATCGATCGGCATCGATCGACTGATCGATCGATCGATCGATCGATCGTACGATCGGCTACGCGCGATCGACGCGCGCGATCGATCGATCGTCGATCGGCGCGCTACGATCG
>C2
AGATGATGAGGATGAGATTGACTACGATCGATCGATGCATCGATCGGCATCGATCGACTGATCGATCGATCGATCGATCGATCGTACGATCGGCTACGCGCGATCGACGCGCGCGATCGATCGATCGTCGATCGGCGCGCTACGATCG
我只需要AGCT序列的长度,所以我在文件中接受(grep)所有不以>开头的内容。然后我想独立计算每个序列的长度,所以最后我得到这样的东西:
150
100
.
.
.
Cn
答案 0 :(得分:0)
grep -v ">" testfile | awk '{ print length }' >> charcount.txt
可能就是你要找的东西。