有没有办法在R中创建一个“字典”,以便它有成对? 有什么影响:
x=dictionary(c("Hi","Why","water") , c(1,5,4))
x["Why"]=5
我问这个是因为我实际上在寻找两个分类变量函数。
如果x =字典(c(“a”,“b”),c(5,2))
x val
1 a 5
2 b 2
我想在x键的所有组合上计算x1 ^ 2 + x2
x1 x2 val1 val2 x1^2+x2
1 a a 5 5 30
2 b a 2 5 9
3 a b 5 2 27
4 b b 2 2 6
然后我希望能够使用x1和x2检索结果。有效的东西: get_result [“b”,“a”] = 9
最好,最有效的方法是什么?
答案 0 :(得分:6)
我知道三个用于词典的R包:hash
,hashmap
和dict
。
2018年7月更新: 新的container
。
2018年9月更新: 新的collections
键必须是字符串。值可以是任何R对象。
library(hash)
## hash-2.2.6 provided by Decision Patterns
h <- hash()
# set values
h[["1"]] <- 42
h[["foo"]] <- "bar"
h[["4"]] <- list(a=1, b=2)
# get values
h[["1"]]
## [1] 42
h[["4"]]
## $a
## [1] 1
##
## $b
## [1] 2
h[c("1", "foo")]
## <hash> containing 2 key-value pair(s).
## 1 : 42
## foo : bar
h[["key not here"]]
## NULL
获取钥匙:
keys(h)
## [1] "1" "4" "foo"
获取值:
values(h)
## $`1`
## [1] 42
##
## $`4`
## $`4`$a
## [1] 1
##
## $`4`$b
## [1] 2
##
##
## $foo
## [1] "bar"
print
实例:
h
## <hash> containing 3 key-value pair(s).
## 1 : 42
## 4 : 1 2
## foo : bar
values
函数接受sapply
:
values(h, USE.NAMES=FALSE)
## [[1]]
## [1] 42
##
## [[2]]
## [[2]]$a
## [1] 1
##
## [[2]]$b
## [1] 2
##
##
## [[3]]
## [1] "bar"
values(h, keys="4")
## 4
## a 1
## b 2
values(h, keys="4", simplify=FALSE)
## $`4`
## $`4`$a
## [1] 1
##
## $`4`$b
## [1] 2
见https://cran.r-project.org/web/packages/hashmap/README.html。
hashmap
不可以灵活地存储任意类型的对象。
键和值仅限于“标量”对象(长度为一个字符,数字等)。值必须是相同的类型。
library(hashmap)
H <- hashmap(c("a", "b"), rnorm(2))
H[["a"]]
## [1] 0.1549271
H[[c("a","b")]]
## [1] 0.1549271 -0.1222048
H[[1]] <- 9
漂亮的print
个实例:
H
## ## (character) => (numeric)
## ## [1] => [+9.000000]
## ## [b] => [-0.122205]
## ## [a] => [+0.154927]
错误:
H[[2]] <- "Z"
## Error in x$`[[<-`(i, value): Not compatible with requested type: [type=character; target=double].
H[[2]] <- c(1,3)
## Warning in x$`[[<-`(i, value): length(keys) != length(values)!
目前仅在Github上提供:https://github.com/mkuhn/dict
优势:任意键和值,速度快。
library(dict)
d <- dict()
d[[1]] <- 42
d[[c(2, 3)]] <- "Hello!" # c(2,3) is the key
d[["foo"]] <- "bar"
d[[4]] <- list(a=1, b=2)
d[[1]]
## [1] 42
d[[c(2, 3)]]
## [1] "Hello!"
d[[4]]
## $a
## [1] 1
##
## $b
## [1] 2
访问不存在的密钥会引发错误:
d[["not here"]]
## Error in d$get_or_stop(key): Key error: [1] "not here"
但有一个很好的功能可以解决这个问题:
d$get("not here", "default value for missing key")
## [1] "default value for missing key"
获取密钥:
d$keys()
## [[1]]
## [1] 4
##
## [[2]]
## [1] 1
##
## [[3]]
## [1] 2 3
##
## [[4]]
## [1] "foo"
获取价值观:
d$values()
## [[1]]
## [1] 42
##
## [[2]]
## [1] "Hello!"
##
## [[3]]
## [1] "bar"
##
## [[4]]
## [[4]]$a
## [1] 1
##
## [[4]]$b
## [1] 2
获取物品:
d$items()
## [[1]]
## [[1]]$key
## [1] 4
##
## [[1]]$value
## [[1]]$value$a
## [1] 1
##
## [[1]]$value$b
## [1] 2
##
##
##
## [[2]]
## [[2]]$key
## [1] 1
##
## [[2]]$value
## [1] 42
##
##
## [[3]]
## [[3]]$key
## [1] 2 3
##
## [[3]]$value
## [1] "Hello!"
##
##
## [[4]]
## [[4]]$key
## [1] "foo"
##
## [[4]]$value
## [1] "bar"
没有print
个实例。
该软件包还提供函数numvecdict
来处理字典,其中数字和字符串(包括每个的向量)可以用作键,并且只能存储数字向量。
答案 1 :(得分:2)
在那些向量中,矩阵,列表等在R中表现为“词典”,您可以执行以下操作:
> (x <- structure(c(5,2),names=c("a","b"))) ## "dictionary"
a b
5 2
> (result <- outer(x,x,function(x1,x2) x1^2+x2))
a b
a 30 27
b 9 6
> result["b","a"]
[1] 9
如果你想在你的例子中展示一张桌子,只需重新塑造你的阵列......
> library(reshape)
> (dfr <- melt(result,varnames=c("x1","x2")))
x1 x2 value
1 a a 30
2 b a 9
3 a b 27
4 b b 6
> transform(dfr,val1=x[x1],val2=x[x2])
x1 x2 value val1 val2
1 a a 30 5 5
2 b a 9 2 5
3 a b 27 5 2
4 b b 6 2 2
答案 2 :(得分:2)
您只能使用--date=xxx
和data.frame
来做到这一点:
row.names
答案 3 :(得分:1)
查看我的answer to a very recent question。从本质上讲,您可以使用环境来实现此类功能。
对于更高维度的情况,如果您希望使用简单的语法来检索结果(可以命名行和列),最好使用array
(二维)。作为替代方案,您可以paste
将两个密钥与一个不存在的分隔符放在一起,然后将其用作唯一标识符。
具体来说,就像这样:
tmp<-data.frame(x=c("a", "b"), val=c(5,2))
tmp2<-outer(seq(nrow(tmp)), seq(nrow(tmp)), function(lhs, rhs){tmp$val[lhs] + tmp$val[rhs]})
dimnames(tmp2)<-list(tmp$x, tmp$x)
tmp2
tmp2["a", "b"]