我正在尝试从“SRA工具包”运行“fastq-dump”,从NCBI服务器下载和提取基因组数据。我已经设置了一个GCE实例,在根卷上安装了该程序,并在我计划保留结果文件的地方附加/安装了一个额外的卷。每次提取都会产生两个~11GB的文件,并且在我设置的基本实例上大约需要30分钟。
现在,如果我通过“简单”方式(Google浏览器外壳)访问我的实例,则在完成一次提取之前,连接几乎总是被中断。似乎进程也停止了,输出文件不完整,并且根卷上的一堆空间(fastq-dump所在的位置)被隐藏的文件怪物(下面的4.6G)占用。
user@basic-machine:~$ df -h
Filesystem Size Used Avail Use% Mounted on
/dev/sda1 30G 4.6G 24G 17% /
udev 10M 0 10M 0% /dev
tmpfs 743M 8.3M 735M 2% /run
tmpfs 1.9G 0 1.9G 0% /dev/shm
tmpfs 5.0M 0 5.0M 0% /run/lock
tmpfs 1.9G 0 1.9G 0% /sys/fs/cgroup
/dev/sdb 197G 83G 104G 45% /home/user/datavol
相反,如果我创建自己的SSH密钥并通过我自己的shell连接到实例,则该过程始终完成并且我似乎利用了更多的CPU容量。下面的第一个峰值是浏览器shell,第二个峰值是通过我自己的SSH连接:
现在我的问题是,为什么运行相同的命令会产生不同的结果,具体取决于您使用的shell?如果有的话,使用谷歌浏览器外壳有什么好处?