我正在检索一些Web数据,解析它,并将输出作为Pandas DataFrame存储到HDF5文件中。在我将DataFrame
写入H5文件之前,我添加了自己的描述字符串来注释一些关于数据来源的元数据以及解析时是否出现任何问题。
In [1]: my_data_frame.desc = "Some string about the data"
In [2]: my_data_frame.desc
Out[1]: "Some string about the data"
In [3]: print type(my_data_frame)
<class 'pandas.core.frame.DataFrame'>
但是,在使用pandas.io.pytables.HDFStore()
加载相同的数据后,我添加的desc
属性丢失,我收到错误:AttributeError: 'DataFrame' object has no attribute 'desc'
,好像我从未添加过这个新属性。
如何将我的元数据描述作为DataFrame对象的额外属性保留? (或者是否存在一些我可以为我的元数据目的而劫持的DataFrame现有的,已识别的属性?)
答案 0 :(得分:1)
添加DataFrame元数据或每列元数据已在路线图上,但尚未实施。不过,我对有关API应该是什么样子的想法持开放态度。