学习ILNumerics HDF5 API。我真的很喜欢使用C#对象初始化器在一个表达式中设置复杂HDF5文件的选项。我创建了以下文件:
using (var f = new H5File("myFile.h5")) {
f.Add(new H5Group("myTopNode") {
new H5Dataset("dsNo1", ILMath.vec<float>(1,200)), // no attributes
new H5Group("myGroup") {
new H5Dataset("dsYes", ILMath.rand(100,200)) { // matching dataset
Attributes = {
{ "att1", 1 },
{ "att2", 2 }
}
},
new H5Dataset("dsNo2") { // attributes but wrong name
Attributes = {
{ "wrong1", -100 },
{ "wrong2", -200 }
}
}
}
});
}
现在我正在寻找一种巧妙的方法来迭代文件并过滤具有特定属性的数据集。 我想找到名称中至少有一个属性为“att”的所有数据集,收集并返回其内容。这是我到目前为止所做的:
IList<ILArray<double>> list = new List<ILArray<double>>();
using (var f = new H5File("myFile.h5")) {
var groups = f.Groups;
foreach (var g in groups) {
foreach (var obj in g) {
if (obj.H5Type == H5ObjectTypes.Dataset && obj.Name.Contains("ds")) {
var ds = obj as H5Dataset;
// look for attributes
foreach (var att in ds.Attributes) {
//ds.Attributes["att"].
if (att.Name.Contains("att")) {
list.Add(ds.Get<double>());
}
}
}
}
}
}
return list;
但它不能递归地工作。我可以采用它,但ILNumerics声称方便所以必须有更好的方法吗?类似于python中的h5py?
答案 0 :(得分:1)
H5Group
提供了Find<T>
方法,可以满足您的需求。它迭代整个子树,考虑任意谓词:
var matches = f.Find<H5Dataset>(
predicate: ds => ds.Attributes.Any(a => a.Name.Contains("att")));
为什么不让你的功能返回&#39; ILCell&#39;而不是列表&#39;?这更好地集成到ILNumerics内存管理中(没有存储和等待垃圾收集器来):
using (var f = new H5File("myFile.h5")) {
// create container for the dataset contents
ILCell c = cell(size(1, 1)); // one element init
// retrieve datasets filtered
var matches = f.Find<H5Dataset>(predicate: ds => {
if (ds.Attributes.Any(a => a.Name.Contains("att"))) {
c[end + 1] = ds.Get<double>();
return true;
}
return false;
});
return c;
}
一些链接:
http://ilnumerics.net/hdf5-interface.html