R中是否有字典功能

时间:2011-10-19 09:10:12

标签: r dictionary

有没有办法在R中创建一个“字典”,以便它有成对? 有什么影响:

x=dictionary(c("Hi","Why","water") , c(1,5,4))
x["Why"]=5

我问这个是因为我实际上在寻找两个分类变量函数。

如果x =字典(c(“a”,“b”),c(5,2))

     x  val
1    a  5 
2    b  2 

我想在x键的所有组合上计算x1 ^ 2 + x2

     x1 x2 val1  val2  x1^2+x2
1    a  a   5     5      30
2    b  a   2     5      9
3    a  b   5     2      27
4    b  b   2     2      6

然后我希望能够使用x1和x2检索结果。有效的东西: get_result [“b”,“a”] = 9

最好,最有效的方法是什么?

4 个答案:

答案 0 :(得分:6)

我知道三个用于词典的R包:hashhashmapdict

2018年7月更新: 新的container

2018年9月更新: 新的collections

散列

键必须是字符串。值可以是任何R对象。

library(hash)
## hash-2.2.6 provided by Decision Patterns
h <- hash() 
# set values
h[["1"]] <- 42
h[["foo"]] <- "bar"
h[["4"]] <- list(a=1, b=2)
# get values
h[["1"]]
## [1] 42
h[["4"]]
## $a
## [1] 1
## 
## $b
## [1] 2
h[c("1", "foo")]
## <hash> containing 2 key-value pair(s).
##   1 : 42
##   foo : bar
h[["key not here"]]
## NULL

获取钥匙:

keys(h)
## [1] "1"   "4"   "foo"

获取值:

values(h)
## $`1`
## [1] 42
## 
## $`4`
## $`4`$a
## [1] 1
## 
## $`4`$b
## [1] 2
## 
## 
## $foo
## [1] "bar"

print实例:

h
## <hash> containing 3 key-value pair(s).
##   1 : 42
##   4 : 1 2
##   foo : bar

values函数接受sapply

的参数
values(h, USE.NAMES=FALSE)
## [[1]]
## [1] 42
## 
## [[2]]
## [[2]]$a
## [1] 1
## 
## [[2]]$b
## [1] 2
## 
## 
## [[3]]
## [1] "bar"
values(h, keys="4")
##   4
## a 1
## b 2
values(h, keys="4", simplify=FALSE)
## $`4`
## $`4`$a
## [1] 1
## 
## $`4`$b
## [1] 2

散列映射

https://cran.r-project.org/web/packages/hashmap/README.html

hashmap 可以灵活地存储任意类型的对象。

键和值仅限于“标量”对象(长度为一个字符,数字等)。值必须是相同的类型。

library(hashmap)
H <- hashmap(c("a", "b"), rnorm(2))
H[["a"]]
## [1] 0.1549271
H[[c("a","b")]]
## [1]  0.1549271 -0.1222048
H[[1]] <- 9

漂亮的print个实例:

H
## ## (character) => (numeric)  
## ##         [1] => [+9.000000]
## ##         [b] => [-0.122205]
## ##         [a] => [+0.154927]

错误:

H[[2]] <- "Z"
## Error in x$`[[<-`(i, value): Not compatible with requested type: [type=character; target=double].
H[[2]] <- c(1,3)
## Warning in x$`[[<-`(i, value): length(keys) != length(values)!

字典

目前仅在Github上提供:https://github.com/mkuhn/dict

优势任意键和值,速度快。

library(dict)
d <- dict()
d[[1]] <- 42
d[[c(2, 3)]] <- "Hello!" # c(2,3) is the key
d[["foo"]] <- "bar"
d[[4]] <- list(a=1, b=2)
d[[1]]
## [1] 42
d[[c(2, 3)]]
## [1] "Hello!"
d[[4]]
## $a
## [1] 1
## 
## $b
## [1] 2

访问不存在的密钥会引发错误:

d[["not here"]]
## Error in d$get_or_stop(key): Key error: [1] "not here"

但有一个很好的功能可以解决这个问题:

d$get("not here", "default value for missing key")
## [1] "default value for missing key"

获取密钥:

d$keys()
## [[1]]
## [1] 4
## 
## [[2]]
## [1] 1
## 
## [[3]]
## [1] 2 3
## 
## [[4]]
## [1] "foo"

获取价值观:

d$values()
## [[1]]
## [1] 42
## 
## [[2]]
## [1] "Hello!"
## 
## [[3]]
## [1] "bar"
## 
## [[4]]
## [[4]]$a
## [1] 1
## 
## [[4]]$b
## [1] 2

获取物品:

d$items()
## [[1]]
## [[1]]$key
## [1] 4
## 
## [[1]]$value
## [[1]]$value$a
## [1] 1
## 
## [[1]]$value$b
## [1] 2
## 
## 
## 
## [[2]]
## [[2]]$key
## [1] 1
## 
## [[2]]$value
## [1] 42
## 
## 
## [[3]]
## [[3]]$key
## [1] 2 3
## 
## [[3]]$value
## [1] "Hello!"
## 
## 
## [[4]]
## [[4]]$key
## [1] "foo"
## 
## [[4]]$value
## [1] "bar"

没有print个实例。

该软件包还提供函数numvecdict来处理字典,其中数字和字符串(包括每个的向量)可以用作键,并且只能存储数字向量。

答案 1 :(得分:2)

在那些向量中,矩阵,列表等在R中表现为“词典”,您可以执行以下操作:

> (x <- structure(c(5,2),names=c("a","b"))) ## "dictionary"
a b 
5 2 
> (result <- outer(x,x,function(x1,x2) x1^2+x2))
   a  b
a 30 27
b  9  6
> result["b","a"]
[1] 9

如果你想在你的例子中展示一张桌子,只需重新塑造你的阵列......

> library(reshape)
> (dfr <- melt(result,varnames=c("x1","x2")))
  x1 x2 value
1  a  a    30
2  b  a     9
3  a  b    27
4  b  b     6
> transform(dfr,val1=x[x1],val2=x[x2])
  x1 x2 value val1 val2
1  a  a    30    5    5
2  b  a     9    2    5
3  a  b    27    5    2
4  b  b     6    2    2

答案 2 :(得分:2)

您只能使用--date=xxxdata.frame来做到这一点:

row.names

答案 3 :(得分:1)

查看我的answer to a very recent question。从本质上讲,您可以使用环境来实现此类功能。

对于更高维度的情况,如果您希望使用简单的语法来检索结果(可以命名行和列),最好使用array(二维)。作为替代方案,您可以paste将两个密钥与一个不存在的分隔符放在一起,然后将其用作唯一标识符。

具体来说,就像这样:

tmp<-data.frame(x=c("a", "b"), val=c(5,2))
tmp2<-outer(seq(nrow(tmp)), seq(nrow(tmp)), function(lhs, rhs){tmp$val[lhs] + tmp$val[rhs]})
dimnames(tmp2)<-list(tmp$x, tmp$x)
tmp2
tmp2["a", "b"]