我正在使用d3.js将动物家族(有机体)可视化(一次最多4000个)作为树形图,尽管数据源也可以是目录列表或命名空间对象列表。我的数据如下:
json = {
organisms:[
{name: 'Hemiptera.Miridae.Kanakamiris'},
{name: 'Hemiptera.Miridae.Neophloeobia.incisa'},
{name: 'Lepidoptera.Nymphalidae.Ephinephile.rawnsleyi'},
... etc ...
]
}
我的问题是:我正在尝试找到将上述数据转换为分层父/子数据结构的最佳方法,正如许多d3可视化使用的那样,例如treemap(对于数据示例,请参阅d3 / examples / data /目录中的flare.json。 以下是所需数据结构的示例:
{"name": "ROOT",
"children": [
{"name": "Hemiptera",
"children": [
{"name": "Miridae",
"children": [
{"name": "Kanakamiris", "children":[]},
{"name": "Neophloeobia",
"children": [
{"name": "incisa", "children":[] }
]}
]}
]},
{"name": "Lepidoptera",
"children": [
{"name": "Nymphalidae",
"children": [
{"name": "Ephinephile",
"children": [
{"name": "rawnsleyi", "children":[] }
]}
]}
]}
]}
}
编辑:在ROOT
节点内包含所有原始所需的数据结构,以便符合d3示例的结构,这些示例只有一个主父节点。
我希望了解一般的设计模式,作为奖励,我很乐意在javascript,php,(甚至是python)中看到一些解决方案。 javascript是我的偏好。 关于php:我实际使用的数据来自php脚本对数据库的调用,该脚本将结果编码为json。 php脚本中的数据库结果是一个有序数组(见下文),如果这是基于php的答案的任何用途。
Array
(
[0] => Array
(
['Rank_Order'] => 'Hemiptera'
['Rank_Family'] => 'Miridae'
['Rank_Genus'] => 'Kanakamiris'
['Rank_Species'] => ''
) ........
其中:
'Rank_Order'
isParentOf 'Rank_Family'
isParentOf 'Rank_Genus'
isParentOf 'Rank_Species'
我问了一个类似的问题,专注于一个php解决方案here,但唯一的答案是没有在我的服务器上工作,我不太明白发生了什么,所以我想从设计中提出这个问题模式透视,并包括我在javascript和d3.js中的实际使用的参考。
答案 0 :(得分:7)
以下内容特定于您提供的结构,可以相当容易地使其更通用。我确信 addChild 功能可以简化。希望这些评论很有用。
function toHeirarchy(obj) {
// Get the organisms array
var orgName, orgNames = obj.organisms;
// Make root object
var root = {name:'ROOT', children:[]};
// For each organism, get the name parts
for (var i=0, iLen=orgNames.length; i<iLen; i++) {
orgName = orgNames[i].name.split('.');
// Start from root.children
children = root.children;
// For each part of name, get child if already have it
// or add new object and child if not
for (var j=0, jLen=orgName.length; j<jLen; j++) {
children = addChild(children, orgName[j]);
}
}
return root;
// Helper function, iterates over children looking for
// name. If found, returns its child array, otherwise adds a new
// child object and child array and returns it.
function addChild(children, name) {
// Look for name in children
for (var i=0, iLen=children.length; i<iLen; i++) {
// If find name, return its child array
if (children[i].name == name) {
return children[i].children;
}
}
// If didn't find name, add a new object and
// return its child array
children.push({'name': name, 'children':[]});
return children[children.length - 1].children;
}
}
答案 1 :(得分:5)
鉴于您的开始输入,我相信类似下面的代码将产生您想要的输出。我不认为这是最漂亮的方式,但这是当时想到的。
对数据进行预处理似乎最容易,首先将初始字符串数组拆分为数组数组,如下所示:
[
["Hemiptera","Miridae","Kanakamiris" ],
["Hemiptera","Miridae","Neophloeobia","incisa" ],
//etc
]
...然后处理以获得如下形式的工作对象:
working = {
Hemiptera : {
Miridae : {
Kanakamiris : {},
Neophloeobia : {
incisa : {}
}
}
},
Lepidoptera : {
Nymphalidae : {
Ephinephile : {
rawnsleyi : {}
}
}
}
}
...因为使用对象而不是数组可以更容易地测试子项是否已经存在。创建了上述结构后,我最后一次处理它以获得最终所需的输出。所以:
// start by remapping the data to an array of arrays
var organisms = data.organisms.map(function(v) {
return v.name.split(".");
});
// this function recursively processes the above array of arrays
// to create an object whose properties are also objects
function addToHeirarchy(val, level, heirarchy) {
if (val[level]) {
if (!heirarchy.hasOwnProperty(val[level]))
heirarchy[val[level]] = {};
addToHeirarchy(val, level + 1, heirarchy[val[level]]);
}
}
var working = {};
for (var i = 0; i < organisms.length; i++)
addToHeirarchy(organisms[i], 0, working);
// this function recursively processes the object created above
// to create the desired final structure
function remapHeirarchy(item) {
var children = [];
for (var k in item) {
children.push({
"name" : k,
"children" : remapHeirarchy(item[k])
});
}
return children;
}
var heirarchy = {
"name" : "ROOT",
"children" : remapHeirarchy(working)
};
答案 2 :(得分:2)
我自己的问题的替代答案....在过去的一天里,我已经学习了很多关于d3.js以及与{。3}}和.key()和.entries相关的问题()是我的朋友(所有d3功能)。 这个答案涉及更改初始数据,因此它可能不符合我提出的具体问题的良好答案。但是,如果某人有类似的问题并且可以在服务器上进行更改,那么这是一个非常简单的解决方案:
以这种格式从数据库中返回数据:
json = {'Organisms': [
{ 'Rank_Order': 'Hemiptera',
'Rank_Family': 'Miridae',
'Rank_Genus': 'Kanakamiris',
'Rank_Species': '' },
{}, ...
]}
然后使用d3.nest()
organismNest = d3.nest()
.key(function(d){return d.Rank_Order;})
.key(function(d){return d.Rank_Family;})
.key(function(d){return d.Rank_Genus;})
.key(function(d){return d.Rank_Species;})
.entries(json.Organism);
返回:
{
key: "Hemiptera"
values: [
{
key: "Cicadidae"
values: [
{
key: "Pauropsalta "
values: [
{
key: "siccanus"
values: [
Rank_Family: "Cicadidae"
Rank_Genus: "Pauropsalta "
Rank_Order: "Hemiptera"
Rank_Species: "siccanus"
AnotherOriginalDataKey: "original data value"
etc etc, nested and lovely
这返回的内容非常类似于我在问题中描述为我想要的格式的数组,但有一些区别。特别是,没有所有封闭的ROOT元素,而且我最初想要的键是“name”和“children”.nest()分别将键作为“key”和“values”返回。 通过定义适当的数据访问器功能(基本d3概念),这些备选键很容易在d3.js中使用......但这超出了问题的原始范围...希望对某人也有帮助