从R开始在pandas中我们对R的生产使用是将大量数据保存为.RData(通过save_image)到磁盘并在下次加载工作区时使用它。似乎没有真正的解决方案将整个pandas工作区保存到磁盘。
有Dill,但看起来不值得生产。 这是Pandas / Numpy的反模式吗?我认为应该有类似HDF5(或最近宣布的Apache Arrow)的东西来快照运行状态。
请注意我并不是在谈论休眠 - 我只是在这里引用数据结构,而不是运行代码状态或类似的东西。
此外有关IRC的讨论提及:
所以它的糟糕方式?