Python中类似的.rdata功能?

时间:2012-01-07 20:59:29

标签: python r

我开始学习在Python中进行数据分析。

在R中,您可以将数据加载到内存中,然后将变量保存到.rdata文件中。

我正在尝试创建一个分析“项目”,所以我可以加载数据,存储脚本,然后保存输出,以便我可以在需要时回忆它。

Python中是否有等效函数?

由于

2 个答案:

答案 0 :(得分:12)

您正在寻找的是二进制序列化。 Python中最值得注意的功能是pickle。如果您有一些标准的科学数据结构,您可以改为使用HDF5。 JSON也适用于很多对象,但它不是二进制序列化 - 它是基于文本的。

如果扩展选项,还有很多其他序列化选项。比如谷歌的协议缓冲区(Rprotobuf的开发者是SO上标签的排名最高的回答者),Avro,Thrift等等。

虽然存在通用序列化选项,例如pickle.Rdat,但仔细考虑您的使用情况将有助于使I / O快速且适合您的需求,尤其是在您需要随机访问时,可移植性,并行访问,工具重用等。例如,我现在倾向于避免使用.Rdat大型对象。

答案 1 :(得分:2)