Question

我在Julia有一个Dict

In[27]:  CollectedOutputCount
Out[27]: Dict{Any,Any} with 3 entries:
  2 => Any[278963,1,1]
  3 => Any[283339,1,1]
  1 => Any[272878,0,0,0]

我想从Dict的内容创建一个Array，其中包含每个Dict条目2：end的总和。每个Dict条目中的第一个值是标签。输出需要类似

Output = [ label sum;label sum;...]

在这种情况下它将是

Output = [278963 2;283339 2;272878 0]

除了循环迭代之外，有没有办法做到这一点？是否有一些功能可以将Dict压缩成一个数组（可能有填充，其中有不均匀的尺寸）？

Answer 1

我不确定能够以这种自定义方式压缩字典的函数，但您可以使用map来避免循环：

鉴于你的字典：

CollectedOutputCount = Dict(2 => [278963,1,1], 3 => [283339,1,1], 1 => [272878,0,0,0], 4 => [1234])

你可以把它压成[标签总和;标签总和...]在一行：

vcat(map(a -> [a[1] sum(a[2:end])], values(CollectedOutputCount))...)

这给了你：

4x2 Array{Int64,2}:
1234  0
278963  2
283339  2
272878  0

map将函数应用于数组的所有元素，在本例中为字典的值迭代器。然后，您可以使用vcat附加这些内容。请注意，当字典中没有值时，sum给出了0，只有1个元素作为标签(1234 0)。

Answer 2

@ niczky12的替代等效选项，但使用列表理解;

>>> mydict =  Dict(2 => [278963,1,1], 3 => [283339,1,1], 
                   1 => [272878,0,0,0], 4 => [1234]);
>>> comp = [[a[1] sum(a[2:end])] for a in values(mydict)];

主要区别在于使用列表推导而不是map功能。它们是等价的（在这种情况下）。

但是，comp是一个包含4个条目的数组，其中每个条目都是1x2数组。要将其翻译为4x2 array：

>>> vcat(comp...)
4x2 Array{Int64,2}:
   1234  0
 278963  2
 283339  2
 272878  0

但是，如果字典的所有数组都具有相同的长度，则可以将它们连接起来，并替换最后一列：

>>> mydict = Dict(2 => [278963,1,0], 3 => [283339,1,1], 1 => [272878,0,0])
>>> vals = hcat(values(mydict)...)';
>>> hcat(vals[:, 1], sum(vals[:, 2:end], 2))
3x2 Array{Int64,2}:
 278963  1
 283339  2
 272878  0

虽然，迭代版本可能更有效。

最后，一个完全迭代的版本，它不会创建不必要的临时存储：

r = zeros(Int64, length(mydict), 2)
for (n, b) in enumerate(values(mydict))
    r[n, 1] = b[1]
    r[n, 2] = sum(b[2:end])
end

在朱莉娅中平整一个字典

2 个答案: