我发现Crossfilter的所有例子都使用这样的扁平结构:
[
{ name: “Rusty”, type: “human”, legs: 2 },
{ name: “Alex”, type: “human”, legs: 2 },
...
{ name: “Fiona”, type: “plant”, legs: 0 }
]
或
"date","open","high","low","close","volume","oi" 11/01/1985,115.48,116.78,115.48,116.28,900900,0 11/04/1985,116.28,117.07,115.82,116.04,753400,0
11/05/1985,116.04,116.57,115.88,116.44,876800,0
我处理了数百MB的平面文件,以产生1-2MB的JSON对象,结构大致如下:
{
"meta": {"stuff": "here"},
"data": {
"accountName": {
// rolled up by week
"2013-05-20": {
// any of several "dimensions"
"byDay": {
"2013-05-26": {
"values": {
"thing1": 1,
"thing2": 2,
"etc": 3
}
},
"2013-05-27": {
"values": {
"thing1": 4,
"thing2": 5,
"etc": 6
}
}
// and so on for day
},
"bySource": {
"sourceA": {
"values": {
"thing1": 2,
"thing2": 6,
"etc": 7
}
},
"sourceB": {
"values": {
"thing1": 3,
"thing2": 1,
"etc": 2
}
}
}
}
}
}
}
我希望将其显示为如下表格:
Group: byDay* || bySource || byWhatever
| thing1 | thing2 | etc
2013-05-26 | 1 | 2 | 2
2013-05-27 | 4 | 5 | 7
或:
Group: byDay || bySource* || byWhatever
| thing1 | thing2 | etc
sourceA | 2 | 6 | 6
sourceB | 3 | 1 | 3
展平此JSON结构将很困难并产生非常大的对象。
我很想利用Crossfilter的精彩功能,但我不确定它是否可能。
我可以将我当前的结构定义/解释为Crossfilter吗?也许还有另一种方法可以解决这个问题?我很乐意承认,我对尺寸和许多其他关键的Crossfilter概念都没有很好的把握。
答案 0 :(得分:6)
Crossfilter对记录数组起作用,数组的每个元素都通过维度(使用访问器函数定义)映射到一个或多个值。
即使您的数据包含汇总结果,您也可以将其与Crossfilter结合使用,但请注意,技术上不可能组合跨不同维度汇总的数据,例如合并“按天”和上面示例中的“by source”数据。您可以为每个聚合维度创建一个Crossfilter,例如一个用于“按天”,并对此运行查询和组,但我不确定与您已有的相比有多大用处。
至于内存使用情况,你确定扁平化扁平结构是否真的有问题?请记住,每个记录(展平数组的元素)都可以包含引用到嵌套结构中的字符串和其他对象,因此您不必耗尽所有这么多内存。