如何使用C

时间:2017-05-30 04:51:12

标签: hdf5

所以我有一个包含数据集的hdf5文件:

DATASET "updateDateTime" {DATATYPE  H5T_STRING{
    STRSIZE 24;
STRPAD H5T_STR_NULLPAD;
CSET H5T_CSET_ASCII;
CTYPE H5T_C_S1;
}
    DATASPACE  SIMPLE{ (5) / (5) }
    DATA{
    (0) : "2015-05-12\000\000\000\000\000\000\000\000\000\000\000\000\000\000",
    (1) : "2015-05-13\000\000\000\000\000\000\000\000\000\000\000\000\000\000",
    (2) : "2015-05-14\000\000\000\000\000\000\000\000\000\000\000\000\000\000",
    (3) : "2015-05-15\000\000\000\000\000\000\000\000\000\000\000\000\000\000",
    (4) : "2015-05-16\000\000\000\000\000\000\000\000\000\000\000\000\000\000"
}

我想用C读取这个数据集,但我找不到合适的例子(我是HDF5的新手)。具体来说,我无法确定阅读时使用哪个H5T_NATIVE_ *。这是我现在的代码:

hid_t  time_ds = H5Dopen(grp, "updateDateTime", H5P_DEFAULT);
auto time_shape = get_dataset_shape(time_ds);
char** time_str = (char **)malloc(time_shape[0] * sizeof(char *)); // TODO: memeory allocation correct??

 status = H5Dread(time_ds, H5T_NATIVE_CHAR, H5S_ALL, H5S_ALL, H5P_DEFAULT,
    time_str);
 /*do my stuff*/

free(time_str);
status = H5Dclose(time_ds);

3 个答案:

答案 0 :(得分:0)

尝试

char* time_str = (char*) malloc(time_shape[0] * sizeof(char));

status = H5Dread(time_ds, H5T_NATIVE_CHAR, H5S_ALL, H5S_ALL, H5P_DEFAULT, &time_str);

答案 1 :(得分:0)

在深入研究h5dump的源代码(该工具与hdf5包一起使用)后,我终于开始工作了。我不能说这是一个很好的解决方案,但希望这可以帮助遇到类似问题的其他人。

事实证明,本函数可以推测本机类型

type = H5Dget_type(dset);
native_type = h5tools_get_native_type(type);
auto shape = get_dataset_shape(dset);
n_element = std::accumulate(shape.begin(), shape.end(), 1ull, std::multiplies<size_t>());
type_size = std::max(H5Tget_size(type), H5Tget_size(native_type));
size_t alloc_size = n_element * type_size;
char * buf = BAT_NEW char[alloc_size]; 

status = H5Dread(dset, native_type, H5S_ALL, H5S_ALL, H5P_DEFAULT, buf);

/*do my stuff*/

H5Tclose(native_type);
H5Tclose(type);
delete[] buf;

然后,阅读如下数据集:

{{1}}

答案 2 :(得分:0)

或者,您可以使用C中的HDFql读取数据集(数据类型为H5T_STRING),如下所示:

hdfql_execute("SELECT FROM updateDateTime");
hdfql_cursor_first(NULL);
printf("Dataset value is %s\n", hdfql_cursor_get_char(NULL));

如果数据集存储了多个字符串(通过查看上面发布的h5dump的结果,这似乎是您的情况),您可以通过循环结果集来检索这些字符串:

hdfql_execute("SELECT FROM updateDateTime");
while(hdfql_cursor_next(NULL) == HDFQL_SUCCESS)
{
   printf("Dataset value is %s\n", hdfql_cursor_get_char(NULL));
}