我有2个不等长度的数据集,可以使用ggplots2进行绘图:
Data A;
column x column y
0.23 1.54
0.44 1.46
0.69 1.37
0.70 1.21
0.75 1.01
0.88 0.91
Data B:
column x column y
0.13 1.24
0.34 1.16
0.49 1.07
0.54 0.99
0.69 1.01
我确定如何在ggplot2中编写代码来绘制这两个数据集。在两种情况下,显示为x轴的图=列x和y轴=列y。有人能帮帮我吗?
詹姆斯
答案 0 :(得分:5)
假设您将数据集A和B作为data.frame:
A <- data.frame(x=1:5, y=11:15)
B <- data.frame(x=1:10, y=20:11)
你必须加入他们:
df <- rbind(A, B) # Join A and B together.
df
x y
1 1 11
2 2 12
3 3 13
4 4 14
5 5 15
6 1 20
7 2 19
8 3 18
9 4 17
10 5 16
11 6 15
12 7 14
13 8 13
14 9 12
15 10 11
然后你可以绘制它:
ggplot(data=df, aes(x=x, y=y)) + geom_point()
如果要按颜色区分数据集A和B中的点:
df$dataset <- c(rep("A", nrow(A)), rep("B", nrow(B)))
df
x y dataset
1 1 11 A
2 2 12 A
3 3 13 A
4 4 14 A
5 5 15 A
6 1 20 B
7 2 19 B
8 3 18 B
9 4 17 B
10 5 16 B
11 6 15 B
12 7 14 B
13 8 13 B
14 9 12 B
15 10 11 B
ggplot(data=df, aes(x=x, y=y, col=dataset)) + geom_point()
如果要按颜色和大小区分点和数据集A和B,并更改轴标签:
ggplot(data=df, aes(x=x, y=y, col=dataset, size=dataset)) + geom_point() +
scale_color_manual(name="Dataset", labels = c("Data A","Data B"), values=c("red", "blue")) +
scale_size_manual(name="Dataset", labels = c("Data A","Data B"), values=c(10, 5)) +
xlab("xxxx") + ylab("yyyy")
请参阅Tutorial或使用google:)。
答案 1 :(得分:2)
我知道在绘制数据点(稀疏)和理论曲线上的一条线(其中有很多数据点)时总是会出现这种情况
在这种情况下,您可以分别为每个ggplot的几何形状提供不同的美学映射。
例如[在这里编辑,以便最好的例子成为第一]
ggplot() +
geom_point(data = df_A, aes(x, y)) +
geom_line(data = df_B, aes(x, y), color = "red") +
theme_minimal()
或
ggplot() +
with(df_A, geom_point(aes(x, y))) +
with(df_B, geom_line(aes(x, y)), color = "red") +
theme_minimal()
答案 2 :(得分:1)
一种选择是将数据放入一个data.frame中。以下是使用ldply()
中plyr()
的示例,假设您的data.frames名为d1
和d2
:
library(plyr)
> d3 <- ldply(list(d1 = d2, d2 = d2))
> rbind(head(d3,2), tail(d3,2))
.id column.x column.y
1 d1 0.13 1.24
2 d1 0.34 1.16
9 d2 0.54 0.99
10 d2 0.69 1.01
或者在绘图时简单地将不同的数据集传递给不同的geom。像这样:
ggplot() +
geom_point(data = d1, aes(column.x, column.y)) +
geom_point(data = d2, aes(column.x, column.y), colour = "red")