使用ggplot2绘制具有不等长度的2个数据集

时间:2013-03-22 03:35:57

标签: r ggplot2

我有2个不等长度的数据集,可以使用ggplots2进行绘图:

Data A;

column x column y
0.23     1.54    
0.44     1.46
0.69     1.37
0.70     1.21
0.75     1.01
0.88     0.91 

Data B:

column x column y
0.13     1.24    
0.34     1.16
0.49     1.07
0.54     0.99
0.69     1.01

我确定如何在ggplot2中编写代码来绘制这两个数据集。在两种情况下,显示为x轴的图=列x和y轴=列y。有人能帮帮我吗?

詹姆斯

3 个答案:

答案 0 :(得分:5)

假设您将数据集A和B作为data.frame:

A <- data.frame(x=1:5, y=11:15)
B <- data.frame(x=1:10, y=20:11)

你必须加入他们:

df <- rbind(A, B) # Join A and B together.
df
    x  y
1   1 11
2   2 12
3   3 13
4   4 14
5   5 15
6   1 20
7   2 19
8   3 18
9   4 17
10  5 16
11  6 15
12  7 14
13  8 13
14  9 12
15 10 11

然后你可以绘制它:

ggplot(data=df, aes(x=x, y=y)) + geom_point()

如果要按颜色区分数据集A和B中的点:

df$dataset <- c(rep("A", nrow(A)), rep("B", nrow(B)))
df
    x  y dataset
1   1 11       A
2   2 12       A
3   3 13       A
4   4 14       A
5   5 15       A
6   1 20       B
7   2 19       B
8   3 18       B
9   4 17       B
10  5 16       B
11  6 15       B
12  7 14       B
13  8 13       B
14  9 12       B
15 10 11       B

ggplot(data=df, aes(x=x, y=y, col=dataset)) + geom_point()

如果要按颜色和大小区分点和数据集A和B,并更改轴标签:

ggplot(data=df, aes(x=x, y=y, col=dataset, size=dataset)) + geom_point() +
scale_color_manual(name="Dataset", labels = c("Data A","Data B"), values=c("red", "blue")) + 
scale_size_manual(name="Dataset", labels = c("Data A","Data B"), values=c(10, 5)) + 
xlab("xxxx") + ylab("yyyy")

请参阅Tutorial或使用google:)。

答案 1 :(得分:2)

我知道在绘制数据点(稀疏)和理论曲线上的一条线(其中有很多数据点)时总是会出现这种情况

在这种情况下,您可以分别为每个ggplot的几何形状提供不同的美学映射。

例如[在这里编辑,以便最好的例子成为第一]

ggplot() +
  geom_point(data = df_A, aes(x, y)) + 
  geom_line(data = df_B, aes(x, y), color = "red") +
  theme_minimal() 

ggplot() +
  with(df_A, geom_point(aes(x, y))) + 
  with(df_B, geom_line(aes(x, y)), color = "red") +
  theme_minimal() 

答案 2 :(得分:1)

一种选择是将数据放入一个data.frame中。以下是使用ldply()plyr()的示例,假设您的data.frames名为d1d2

library(plyr)
> d3 <- ldply(list(d1 = d2, d2 = d2))
> rbind(head(d3,2), tail(d3,2))
   .id column.x column.y
1   d1     0.13     1.24
2   d1     0.34     1.16
9   d2     0.54     0.99
10  d2     0.69     1.01

或者在绘图时简单地将不同的数据集传递给不同的geom。像这样:

ggplot() +
  geom_point(data = d1, aes(column.x, column.y)) +
  geom_point(data = d2, aes(column.x, column.y), colour = "red")