Question

我必须使用以下脚本从数据库中下载大量超过100,000个文档：

#!/usr/bin/bash
IFS=$'\n'       
set -f          
for line in $(cat < "$1")
do
  wget https://www.uniprot.org/uniprot/${line}.txt
done

第一次花了一周多的时间下载所有文件（所有文件都在8Kb以下），所以我尝试打开多个终端并运行total.txt的拆分（在10个终端中分别进行10个10000个文件的拆分），我花了14个小时下载了所有文档，有没有办法让脚本帮我做到这一点？

这是列表的示例：

D7E6X7
A0A1L9C3F2
A3K3R8
W0K0I7

Answer 1

还有另一种方法可以使其快速运行。

现在，您的下载已同步，即在当前下载完成之前，不会开始下一个下载过程。

搜索如何使命令异步/在UNIX上在后台运行。

Answer 2

gnome-terminal -e命令要么 xterm -e命令要么 konsole -e命令要么终端-e命令

Answer 3

手工操作时，打开多个端子很有意义。如果要对此编写脚本，则可以从一个终端/脚本运行多个进程。您可以使用xargs同时启动多个进程：

xargs -a list.txt -n 1 -P 8 -I @ bash -c "wget https://www.uniprot.org/uniprot/@.txt"

位置：