Question

有没有办法在R中创建一个“字典”，以便它有成对？有什么影响：

x=dictionary(c("Hi","Why","water") , c(1,5,4))
x["Why"]=5

我问这个是因为我实际上在寻找两个分类变量函数。

如果x =字典（c（“a”，“b”），c（5,2））

     x  val
1    a  5 
2    b  2

我想在x键的所有组合上计算x1 ^ 2 + x2

     x1 x2 val1  val2  x1^2+x2
1    a  a   5     5      30
2    b  a   2     5      9
3    a  b   5     2      27
4    b  b   2     2      6

然后我希望能够使用x1和x2检索结果。有效的东西： get_result [“b”，“a”] = 9

最好，最有效的方法是什么？

Answer 1

我知道三个用于词典的R包：hash，hashmap和dict。

2018年7月更新： 新的container。

2018年9月更新： 新的collections

散列

键必须是字符串。值可以是任何R对象。

library(hash)
## hash-2.2.6 provided by Decision Patterns
h <- hash() 
# set values
h[["1"]] <- 42
h[["foo"]] <- "bar"
h[["4"]] <- list(a=1, b=2)
# get values
h[["1"]]
## [1] 42
h[["4"]]
## $a
## [1] 1
## 
## $b
## [1] 2
h[c("1", "foo")]
## <hash> containing 2 key-value pair(s).
##   1 : 42
##   foo : bar
h[["key not here"]]
## NULL

获取钥匙：

keys(h)
## [1] "1"   "4"   "foo"

获取值：

values(h)
## $`1`
## [1] 42
## 
## $`4`
## $`4`$a
## [1] 1
## 
## $`4`$b
## [1] 2
## 
## 
## $foo
## [1] "bar"

print实例：

h
## <hash> containing 3 key-value pair(s).
##   1 : 42
##   4 : 1 2
##   foo : bar

values函数接受sapply：

的参数

values(h, USE.NAMES=FALSE)
## [[1]]
## [1] 42
## 
## [[2]]
## [[2]]$a
## [1] 1
## 
## [[2]]$b
## [1] 2
## 
## 
## [[3]]
## [1] "bar"
values(h, keys="4")
##   4
## a 1
## b 2
values(h, keys="4", simplify=FALSE)
## $`4`
## $`4`$a
## [1] 1
## 
## $`4`$b
## [1] 2

散列映射

见https://cran.r-project.org/web/packages/hashmap/README.html。

hashmap 不可以灵活地存储任意类型的对象。

键和值仅限于“标量”对象（长度为一个字符，数字等）。值必须是相同的类型。

library(hashmap)
H <- hashmap(c("a", "b"), rnorm(2))
H[["a"]]
## [1] 0.1549271
H[[c("a","b")]]
## [1]  0.1549271 -0.1222048
H[[1]] <- 9

漂亮的print个实例：

H
## ## (character) => (numeric)  
## ##         [1] => [+9.000000]
## ##         [b] => [-0.122205]
## ##         [a] => [+0.154927]

错误：

H[[2]] <- "Z"
## Error in x$`[[<-`(i, value): Not compatible with requested type: [type=character; target=double].
H[[2]] <- c(1,3)
## Warning in x$`[[<-`(i, value): length(keys) != length(values)!

字典

目前仅在Github上提供：https://github.com/mkuhn/dict

优势：任意键和值，速度快。

library(dict)
d <- dict()
d[[1]] <- 42
d[[c(2, 3)]] <- "Hello!" # c(2,3) is the key
d[["foo"]] <- "bar"
d[[4]] <- list(a=1, b=2)
d[[1]]
## [1] 42
d[[c(2, 3)]]
## [1] "Hello!"
d[[4]]
## $a
## [1] 1
## 
## $b
## [1] 2

访问不存在的密钥会引发错误：

d[["not here"]]
## Error in d$get_or_stop(key): Key error: [1] "not here"

但有一个很好的功能可以解决这个问题：

d$get("not here", "default value for missing key")
## [1] "default value for missing key"

获取密钥：

d$keys()
## [[1]]
## [1] 4
## 
## [[2]]
## [1] 1
## 
## [[3]]
## [1] 2 3
## 
## [[4]]
## [1] "foo"

获取价值观：

d$values()
## [[1]]
## [1] 42
## 
## [[2]]
## [1] "Hello!"
## 
## [[3]]
## [1] "bar"
## 
## [[4]]
## [[4]]$a
## [1] 1
## 
## [[4]]$b
## [1] 2

获取物品：

d$items()
## [[1]]
## [[1]]$key
## [1] 4
## 
## [[1]]$value
## [[1]]$value$a
## [1] 1
## 
## [[1]]$value$b
## [1] 2
## 
## 
## 
## [[2]]
## [[2]]$key
## [1] 1
## 
## [[2]]$value
## [1] 42
## 
## 
## [[3]]
## [[3]]$key
## [1] 2 3
## 
## [[3]]$value
## [1] "Hello!"
## 
## 
## [[4]]
## [[4]]$key
## [1] "foo"
## 
## [[4]]$value
## [1] "bar"

没有print个实例。

该软件包还提供函数numvecdict来处理字典，其中数字和字符串（包括每个的向量）可以用作键，并且只能存储数字向量。

Answer 2

在那些向量中，矩阵，列表等在R中表现为“词典”，您可以执行以下操作：

> (x <- structure(c(5,2),names=c("a","b"))) ## "dictionary"
a b 
5 2 
> (result <- outer(x,x,function(x1,x2) x1^2+x2))
   a  b
a 30 27
b  9  6
> result["b","a"]
[1] 9

如果你想在你的例子中展示一张桌子，只需重新塑造你的阵列......

> library(reshape)
> (dfr <- melt(result,varnames=c("x1","x2")))
  x1 x2 value
1  a  a    30
2  b  a     9
3  a  b    27
4  b  b     6
> transform(dfr,val1=x[x1],val2=x[x2])
  x1 x2 value val1 val2
1  a  a    30    5    5
2  b  a     9    2    5
3  a  b    27    5    2
4  b  b     6    2    2

Answer 3

您只能使用--date=xxx和data.frame来做到这一点：

row.names

Answer 4

查看我的answer to a very recent question。从本质上讲，您可以使用环境来实现此类功能。

对于更高维度的情况，如果您希望使用简单的语法来检索结果（可以命名行和列），最好使用array（二维）。作为替代方案，您可以paste将两个密钥与一个不存在的分隔符放在一起，然后将其用作唯一标识符。

具体来说，就像这样：

tmp<-data.frame(x=c("a", "b"), val=c(5,2))
tmp2<-outer(seq(nrow(tmp)), seq(nrow(tmp)), function(lhs, rhs){tmp$val[lhs] + tmp$val[rhs]})
dimnames(tmp2)<-list(tmp$x, tmp$x)
tmp2
tmp2["a", "b"]

R中是否有字典功能

4 个答案:

散列

散列映射

字典