目录(mydir)有1000个文件( ls | wc -l </ strong>),但我只想将 file.num.txt 的文件复制到目录 NUM 即可。这是一个例子:
所以我想在 dir2 file.1.txt 复制到 dir1 , file.2.txt >等等。
答案 0 :(得分:1)
这应该有效:
#!/bin/bash
src="mydir"
dest="/home/user1/store"
dir="dir" #name of the dir without number, i.e dir from dir1, dir2
regex='(.*\.)([0-9]+)(\.txt$)'
for file in "$src"/*;do
if [[ -f $file ]];then
if [[ $file =~ $regex ]];then
mkdir -p "$dest"/"$dir${BASH_REMATCH[2]}"
cp "$file" "$dest"/"$dir${BASH_REMATCH[2]}"
fi
fi
done
说明:
${BASH_REMATCH[2]}
包含从模式$file
匹配的$regex
中捕获的组#2(文件名的数字部分)。模式匹配在if语句中完成:
if [[ $file =~ $regex ]];then
如果目录结构不存在,则使用 mkdir -p
,它将创建它。
答案 1 :(得分:1)
使用GNU Parallel,您可以运行:
parallel '{= $_ = /\.\d+\.txt$/ ? "true" : "false" =} && mkdir -p dir{= s/\D//g =} && cp {} dir{= s/\D//g =}' ::: file.*.txt
第一部分评估为'true'或'false',是一种做'grep'的方法。如果你知道'file。* .txt'都是'file.num.txt'的形式,那就不需要了。
'mkdir -p'将创建目录,如果它还没有。
需要&amp;&amp;'s来确保仅在第一部分评估为'true'时才运行该命令。
GNU Parallel是一个通用的并行程序,可以很容易地在同一台机器上或在你有ssh访问权限的多台机器上并行运行作业。
如果要在4个CPU上运行32个不同的作业,并行化的直接方法是在每个CPU上运行8个作业:
GNU Parallel会在完成后生成一个新进程 - 保持CPU处于活动状态,从而节省时间:
<强>安装强>
如果没有为您的发行版打包GNU Parallel,您可以进行个人安装,不需要root访问权限。这可以在10秒内完成:
(wget -O - pi.dk/3 || curl pi.dk/3/ || fetch -o - http://pi.dk/3) | bash
有关其他安装选项,请参阅http://git.savannah.gnu.org/cgit/parallel.git/tree/README
了解详情
查看更多示例:http://www.gnu.org/software/parallel/man.html
观看介绍视频:https://www.youtube.com/playlist?list=PL284C9FF2488BC6D1
完成教程:http://www.gnu.org/software/parallel/parallel_tutorial.html
注册电子邮件列表以获得支持:https://lists.gnu.org/mailman/listinfo/parallel
答案 2 :(得分:0)
我想知道是否可以使用find
的-exec参数或xargs
来实现这一点,但我仍然坚持使用变量替换文件名。
所以我最终选择了bash's,而
find mydir/ -maxdepth 1 -type f -regex ".*\.[0-9]+\(\|\.txt\)" | \
while read line; do num=${line%\.txt}; \
cp ${line} /home/user1/store/dir${num##*\.}; \
done