我有大型数据文件(超过200K点),想从中生成箱图。
一方面,一旦它们与x轴平行传播,我只能在摆脱异常值时生成一个干净的图。另一方面,一旦他们对我的分析很重要,我想保留异常值。所以,他们不应该扩散到两边。看起来,当gnuplot加倍时,它会自动传播异常值。有人已经遇到过这样的问题吗?有关如何展示异常值而不分散它们的任何想法吗?
我的gnuplot脚本如下:
set terminal png enhanced size 900,500
set output "saida.png"
set style fill solid 0.25 border -1
set style data boxplot
set xtics border in scale 0,0 nomirror norotate offset character 0, 0, 0 autojustify
set ytics border in scale 1,0.5 nomirror norotate offset character 0, 0, 0 autojustify
set ylabel "Y"
set xlabel "X"
set style boxplot candles range 1.50 outliers pt 0 separation 1 labels auto sorted
set yrange [ 4 : 10 ] noreverse nowriteback
set xtics ('1:1' 1, '4:3' 2, '2:1' 3)
plot '11.dat' using (1):1 notitle, '43.dat' using (2):1 notitle, '21.dat' using (3):1 notitle
结果是:
请注意"噪音"胡须:它们是我想要的异常值"纠正"。