Question

我正在尝试从“SRA工具包”运行“fastq-dump”，从NCBI服务器下载和提取基因组数据。我已经设置了一个GCE实例，在根卷上安装了该程序，并在我计划保留结果文件的地方附加/安装了一个额外的卷。每次提取都会产生两个~11GB的文件，并且在我设置的基本实例上大约需要30分钟。

现在，如果我通过“简单”方式（Google浏览器外壳）访问我的实例，则在完成一次提取之前，连接几乎总是被中断。似乎进程也停止了，输出文件不完整，并且根卷上的一堆空间（fastq-dump所在的位置）被隐藏的文件怪物（下面的4.6G）占用。

user@basic-machine:~$ df -h
Filesystem      Size  Used Avail Use% Mounted on
/dev/sda1        30G  4.6G   24G  17% /
udev             10M     0   10M   0% /dev
tmpfs           743M  8.3M  735M   2% /run
tmpfs           1.9G     0  1.9G   0% /dev/shm
tmpfs           5.0M     0  5.0M   0% /run/lock
tmpfs           1.9G     0  1.9G   0% /sys/fs/cgroup
/dev/sdb        197G   83G  104G  45% /home/user/datavol

相反，如果我创建自己的SSH密钥并通过我自己的shell连接到实例，则该过程始终完成并且我似乎利用了更多的CPU容量。下面的第一个峰值是浏览器shell，第二个峰值是通过我自己的SSH连接：

Comparing CPU usage when I use the Google browser shell and Mac shell to run the same software on GCE

现在我的问题是，为什么运行相同的命令会产生不同的结果，具体取决于您使用的shell？如果有的话，使用谷歌浏览器外壳有什么好处？

谷歌浏览器SSH或常规shell访问计算引擎实例？

0 个答案: