应用hexbin后,我想知道原始数据的哪个id或rownumbers最终在哪个bin中。
我目前正在分析空间数据,我正在分组,例如水深和温度。理想情况下,我想将箱的颜色图映射回空间映射,以查看存在更多或更少常见参数组合的位置。我并不一定要hexbin
。
我无法从文档中找出,如何跟踪哪个数据点最终在哪个bin中。似乎hexbin()
只存储计数。
是否有一个函数可以为每个bin生成一个包含一个条目的列表,每个bin都包含分配给该bin的所有rownumber的向量?
请指出我正确的方向。
到目前为止,我使用普通的hexbin进行分箱:
library(hexbin)
set.seed(5)
df <- data.frame(depth=runif(1000,min=0,max=100),temp=runif(1000,min=4,max=14))
h <- hexbin(df)
但是目前我看不到从h将链接到df的hf提取rown的rown。可能没有这样的事情,也许我忽略了它,或者需要一种完全不同的方法。
答案 0 :(得分:2)
假设您使用的是hexbin
软件包,则需要设置IDs=TRUE
才能返回原始行
library(hexbin)
set.seed(5)
df <- data.frame(depth=runif(1000,min=0,max=100),temp=runif(1000,min=4,max=14))
h<-hexbin(df, IDs=TRUE)
然后获取每个观察的bin编号,您可以使用
h@cID
要获得特定观察所填充的单元格中的观察计数,您可以
h@count[match(h@cID, h@cell)]
这个想法是第二个观察df[2,]
在单元格h@cID[2]=424
中。单元格424在单元格列表中处于索引which(h@cell==424)=241
(零计数单元似乎被省略)。该单元格中的观察数量为h@count[241]=2
。