使用Cutadapt实现配对末端读取的自动化

时间:2019-02-23 03:16:56

标签: bioinformatics

我正在尝试使用cutadapt自动化配对末端的读取,但是我仍然遇到相同的问题-适配器是从正向读取中修剪掉的,而不是从反向读取中修剪出来的。即使根据文档修改了代码,问题仍然存在。如果我仅修剪正向或反向,则可以,但是不能作为双端工作。

这是我的代码:

cat ids.txt | parallel 'cutadapt -j 24 -a AGATCGGAA --interleaved {}_R1.fq.gz {}_R2.fq.gz | cutadapt -j 24 -a AGATCGGAA --interleaved -o {}clipped_R1.fq.gz -p {}clipped_R2.fq.gz -'

是否有人提示如何修改此代码以使其正常工作?我在做什么错了?

1 个答案:

答案 0 :(得分:1)

请仔细检查cutadapt文档,其中有一章专门介绍了成对的末端对齐。您正在寻找-A

您还搞砸了--interleaved参数:如果读取是交错的,为什么要给出两端?我不确定您要达到什么目的,但是我敢打赌,您还有一个额外的cutadapt调用。

我猜您正在尝试类似的事情:

cat ids.txt | parallel 'cutadapt -j 24 -a AGATCGGAA -A <proper_adaptor> -o {}clipped_R1.fq.gz -p {}clipped_R2.fq.gz {}_R1.fq.gz {}_R2.fq.gz'