使用两个数据框创建geom_tile图

时间:2018-08-03 02:23:47

标签: r ggplot2 heatmap

下面是R代码,尝试使用geom_tile创建热图。在我的绘图中,我需要绘制一个框的轮廓和单独的一对x // y坐标(在代码中标题为platelocside和platelocheight),并填充(在代码中标题为exitspeed)以完成热图。这是我要绘制的数据框的当前结构(在代码中标记为“ df”)。

structure(list(platelocheight = c(2.594, 3.803, 3.254, 3.599, 
3.617, 3.297, 2.093, 3.611, 2.842, 3.316, 2.872, 3.228, 3.633, 
4.28, 3.309, 2.8, 2.632, 3.754, 2.207, 3.604, 3.443, 2.188, 3.452, 
2.553, 3.382, 3.067, 2.986, 2.785, 2.567, 3.804), platelocside = c(0.059, 
-1.596, -0.65, -0.782, -0.301, -0.104, 0.057, -0.807, 0.003, 
1.661, 0.088, -0.32, -1.115, -0.146, -0.364, -0.952, 0.254, 0.109, 
-0.671, -0.803, -0.212, -0.069, -0.09, -0.472, 0.434, 0.337, 
0.723, 0.508, -0.197, -0.635), exitspeed = c(69.891, 73.352, 
83.942, 85.67, 79.454, 85.277, 81.078, 73.573, 77.272, 59.263, 
97.343, 91.436, 76.264, 83.479, 47.576, 84.13, 60.475, 61.093, 
84.54, 69.959, 88.729, 88.019, 82.18, 83.684, 86.296, 90.605, 
79.945, 59.899, 62.522, 77.75)), .Names = c("platelocheight", 
"platelocside", "exitspeed"), row.names = c(NA, 30L), class = "data.frame")
> 

运行代码时,我可以在输出中获得框的轮廓,但是未绘制其他数据框(标题df)。有谁知道谁可以使用geom_tile来绘制两个单独的数据框?预先感谢!

library(RODBC)
library(ggplot2)


con=odbcConnect('ID',uid='username', pwd = 'password')

df=sqlQuery(con,"select platelocheight, platelocside, exitspeed from tm_sample where pitchcall='InPlay' 
and exitspeed is not null")

topKzone <- 3.5
botKzone <- 1.6
inKzone <- -0.95
outKzone <- 0.95
kZone <- data.frame(
  x=c(inKzone, inKzone, outKzone, outKzone, inKzone),
  y=c(botKzone, topKzone, topKzone, botKzone, botKzone)
)

ggplot(kZone, aes(x,y)) +
  geom_tile(data=df, aes(x=platelocside, y=platelocheight, fill= exitspeed)) +
  scale_fill_distiller(palette = "Spectral") +
  geom_path(lwd=1.5, col="black") +
  coord_fixed() 

1 个答案:

答案 0 :(得分:2)

问题在于,不是使用两个数据帧,而是实现geom_tile()本身。

如果您将geom_tile换成其他几何图形,例如说geom_pointgeom_hex,您会发现该图可以完美呈现:

library(ggplot2)
ggplot(kZone, aes(x,y)) +
  geom_hex(data=df, aes(x=platelocside, y=platelocheight, col=exitspeed)) +
  scale_fill_distiller(palette = "Spectral") +
  geom_path(lwd=1.5, col="black") +
  coord_fixed() 

产生此: enter image description here

了解geom_tile

geom_tile对于您的数据不是一个好的选择,因为您使用的是连续的x和y刻度,与类似散点图的图形相比,使用散点图等方法更可行。

您可以看到一个示例:

ggplot(mtcars, aes(x=as.factor(gear), y=as.factor(cyl), fill=hp))+
    geom_tile()

enter image description here

与您在两个连续变量上调用它的时间相比:

ggplot(mtcars, aes(x=wt, y=mpg, fill=hp))+
    geom_tile()

您将获得效果很小的图块,看起来好像没有绘制任何图块。

回到您的问题,您使用的df具有platelocsideplatelocheight都是数字连续变量。这使geom_hex成为不理想的选择。如果您一定要坚持使用geom_tile,那么我将使用以下两种解决方案之一:

解决方案1 ​​

使用col而不是fill来获取点而不是图块(因为xy不是因子变量)

library(ggplot2)
ggplot(kZone, aes(x,y)) +
  geom_tile(data=df, aes(x=platelocside, y=platelocheight, col=exitspeed), size=4) +
  scale_fill_distiller(palette = "Spectral") +
  geom_path(lwd=1.5, col="black") +
  coord_fixed() 

解决方案2

使xy为因子变量:

df$h <- round(df$platelocheight)
df$s <- round(df$platelocside)

ggplot(kZone, aes(x,y)) +
  geom_tile(data=df, aes(x=s, y=h, fill=exitspeed)) +
  scale_fill_distiller(palette = "Spectral") +
  geom_path(lwd=1.5, col="black") +
  coord_fixed() 

enter image description here