我有两个文件如下:
文件1:
a1,b1,c1,d1,e1,f1,g1,h1
a2,b2,c2,d2,e2,f2,g2,h2
a3,b3,c3,d3,e3,f3,g3,h3
a4,b4,c4,d4,e4,f4,g4,h4
file2的:
x1,y1,z1
x2,y2,z2
x3,y3,z3
x4,y4,z4
我想同时从两者读取并以下面的模式输出变量:
a1,b1,c1,d1,x1,e1,f1,y1,g1,z1,h1
a2,b2,c2,d2,x2,e2,f2,y2,g2,z2,h2
a3,b3,c3,d3,x3,e3,f3,y3,g3,z3,h3
a4,b4,c4,d4,x4,e4,f4,y4,g4,z4,h4
好消息 - 我成功实现了它!
坏消息 - 太多的数组和while循环(太多的计算!)。我正在寻找更简单的东西,因为脚本必须读取大量数据(4k行和1M字)。
限制 - BASH shell(可能不是限制!)
这就是我所做的
exec 5<file1 # Open file into FD 5
exec 6<file2 # Open file into FD 6
while IFS=$"," read -r line1 <&5
IFS=$"," read -r line2 <&6
do
array1=( `echo $line1` )
array2=( `echo $line2` )
array3=("${array1[@]}","${array2[@]}")
echo ${array3[@]} >> tmpline
done
while IFS="," read var1 var2 var3 var4 var5 var6 var7 var8 var9 var10 var11
do
echo -e "$var1,$var2,$var3,$var4,$var9,$var5,$var6,$var10,$var8,$var11,$var9" >> tcomb
done < tmpline
exec 5<&- # Close FD 5
exec 6<&- # Close FD 6
提前致谢 - 我耐心等待:) !!
答案 0 :(得分:3)
试试这个:
exec 5<file1 # Open file into FD 5
exec 6<file2 # Open file into FD 6
while IFS=, read -a t <&5 &&
IFS=, read -a u <&6
do
echo -n "${t[0]},${t[1]},${t[2]},${t[3]},${u[0]},${t[4]},"
echo "${t[5]},${u[1]},${t[6]},${u[2]},${t[7]}"
done >| tcomb
exec 5<&- # Close FD 5
exec 6<&- # Close FD 6
答案 1 :(得分:1)
您可以使用paste
来合并文件的行。然后,你必须重新排序列,我使用Perl:
paste file1 file2 -d, | \
perl -F, -ane 'chomp $F[-1]; $"=","; print "@F[0..3,8,4,5,9,6,10,7]\n"'
答案 2 :(得分:0)
如果您允许自己多次读取文件,并使用bash进程替换:
paste -d , <(cut -d , -f 1-4 file1) \
<(cut -d , -f 1 file2) \
<(cut -d , -f 5-6 file1) \
<(cut -d , -f 2 file2) \
<(cut -d , -f 7 file1) \
<(cut -d , -f 3 file2) \
<(cut -d , -f 8 file1)