在单个图上绘制许多数据集(来自csv)

时间:2012-12-18 22:43:05

标签: r ggplot2

遵循这个例子:

http://wiki.stdout.org/rcookbook/Graphs/Multiple%20graphs%20on%20one%20page%20(ggplot2)/

参见标题为“每个饮食的适合生长曲线”的图表,我想做同样的事情,但是使用CSV文件中的一组数据,例如(值以μs为单位,除了“N”列):

$ head RandomArray25PercentDup.csv 
N   SystemSort  QuickSort   RandomizedQuickSort TopDownMergeSort    BottomUpMergeSort   SelectionSort   InsertionSort   BubbleSort  
4   0   1   0   1   0   1   0   0   
5   0   0   0   1   1   0   1   0   
6   0   0   0   1   1   0   0   0   
7   0   0   0   0   1   0   0   0   
8   0   0   1   0   1   0   1   1   

...

到目前为止我已经尝试过了:

library(ggplot2)
library(reshape2)

data <- read.table("RandomArray25PercentDup.csv",
                   sep="\t",
                   header=TRUE)
data.m <- melt(data, id.vars = 1)

ggplot(data.m, aes(data, value, colour=variable)) +
    geom_point(alpha=.3) +
    geom_smooth(alpha=.2, size=1) +
    ggtitle("Random array with ~25% duplicate values")

我在R的背景非常有限,我正在尝试学习使用各种资源。

我有大约800'000行的数据,每个N的测量重复20次(我之所以希望看到散射是透明的,每个算法的拟合曲线)。

0 个答案:

没有答案