是否可以在不打开或创建hdf5文件的情况下创建PyTables表? 我的意思是,我需要的是在不同的进程中创建一个表(实际上很多表),使用这些表并在一些计算后最终将表存储到hdf5文件中(并确保只有一个进程)一次执行存储)。
原则上我可以对普通的Python数据(数组字符串等)进行所有计算,最后执行存储。但是,为什么我欣赏从一开始就在PyTables上工作的是理智检查。我希望始终确保我使用的数据符合预定义的表格并且不违反形状约束等(并且因为PyTables会检查那些我不需要自己实现的问题)。
非常感谢和亲切的问候, 罗伯特
答案 0 :(得分:1)
您正在寻找pandas great Pytables integration。您将一直使用表格,最后您将能够以最简单的方式保存到hdf5。
答案 1 :(得分:0)
您可以创建具有给定形状和数据类型的numpy数组。
my_array = num.empty(shape=my_shape, dtype=num.float)
如果您需要按名称编制索引,请查看numpy记录数组(nee numpy recarray)
但如果直接使用PyTable-Object,它可以更快(参见基准here)。