Question

我必须为一个巨大的蛋白质组文件计算很多东西，我在数据集中有~30000个preteins。我有一个脚本，其中有很多子脚本需要一个蛋白质文件

在perl：

my output = `somescript -do_something -with_this_single_protein_file`

我想问一下，有没有办法避免将数据集分成30000个文件，每个文件包含一个蛋白质？也许在Python中有一种方法可以给Popen一个字符串IO，一个文件处理程序或什么？

谢谢，Gábor

Answer 1

您可以使用Bash的process substitution自动创建所需的临时文件。

while(<DATASET>) {
   my $output = system("/bin/bash", "-c", "somescript -do_something -with_this_single_protein_file <(echo \"$_\")");
}