我在linux中有一些文件。例如2,我需要在一个文件中混洗文件。
例如
$cat file1
line 1
line 2
line 3
line 4
line 5
line 6
line 7
line 8
和
$cat file2
linea one
linea two
linea three
linea four
linea five
linea six
linea seven
linea eight
后来我改变了两个文件,我可以获得类似的东西:
linea eight
line 4
linea five
line 1
linea three
line 8
linea seven
line 5
linea two
linea one
line 2
linea four
line 7
linea six
line 1
line 6
答案 0 :(得分:76)
您应该使用shuf
command =)
cat file1 file2 | shuf
或者使用Perl:
cat file1 file2 | perl -MList::Util=shuffle -wne 'print shuffle <>;'
答案 1 :(得分:38)
类别:
cat file1 file2 | sort -R
舒夫:
cat file1 file2 | shuf
的Perl:
cat file1 file2 | perl -MList::Util=shuffle -e 'print shuffle<STDIN>'
BASH:
cat file1 file2 | while IFS= read -r line
do
printf "%06d %s\n" $RANDOM "$line"
done | sort -n | cut -c8-
awk中:
cat file1 file2 | awk 'BEGIN{srand()}{printf "%06d %s\n", rand()*1000000, $0;}' | sort -n | cut -c8-
答案 2 :(得分:19)
只是对使用MacPorts的OS X用户的说明:shuf
命令是coreutils
的一部分,并以名称gshuf
安装。
$ sudo port install coreutils
$ gshuf example.txt # or cat example.txt | gshuf
答案 3 :(得分:11)
这是一个不依赖于shuf
或sort -R
的单行,我在我的mac上没有:
while read line; do echo $RANDOM $line; done < my_file | sort -n | cut -f2- -d' '
这会迭代my_file
中的所有行,并以随机顺序重新打印它们。
答案 4 :(得分:6)
我也会使用shuf
。
另一个选项,gnu sort有:
-R, --random-sort
sort by random hash of keys
你可以尝试:
cat file1 file2|sort -R
答案 5 :(得分:6)
您不需要在这里使用管道。单独排序以文件作为参数执行此操作。我会做的
sort -R file1
或者如果您有多个文件
sort -R file1 file2
答案 6 :(得分:1)
这对我有用。它采用了Fisher-Yates shuffle。
randomize()
{
arguments=("$@")
declare -a out
i="$#"
j="0"
while [[ $i -ge "0" ]] ; do
which=$(random_range "0" "$i")
out[j]=${arguments[$which]}
arguments[!which]=${arguments[i]}
(( i-- ))
(( j++ ))
done
echo ${out[*]}
}
random_range()
{
low=$1
range=$(($2 - $1))
if [[ range -ne 0 ]]; then
echo $(($low+$RANDOM % $range))
else
echo "$1"
fi
}
答案 7 :(得分:0)
这显然是有偏见的兰特(就像列表从第一行开始的一半时间)但是对于一些基本的随机化只有bash内置我觉得它很好吗?只需打印每一行是/否,然后打印剩下的......
shuffle() {
local IFS=$'\n' tail=
while read l; do
if [ $((RANDOM%2)) = 1 ]; then
echo "$l"
else
tail="${tail}\n${l}"
fi
done < $1
printf "${tail}\n"
}