我必须为一个巨大的蛋白质组文件计算很多东西,我在数据集中有~30000个preteins。 我有一个脚本,其中有很多子脚本需要一个蛋白质文件
在perl:
my output = `somescript -do_something -with_this_single_protein_file`
我想问一下,有没有办法避免将数据集分成30000个文件,每个文件包含一个蛋白质?也许在Python中有一种方法可以给Popen一个字符串IO,一个文件处理程序或什么?
谢谢,Gábor
答案 0 :(得分:0)
您可以使用Bash的process substitution自动创建所需的临时文件。
while(<DATASET>) {
my $output = system("/bin/bash", "-c", "somescript -do_something -with_this_single_protein_file <(echo \"$_\")");
}