python - 有没有办法以R格式存储pandas数据框？

时间：2014-05-21 09:52:53

标签： python r csv pandas

R有自己的格式，比csv更有表现力（例如，了解因素）。扩展名通常是.Rdata，使用load和save函数从R操作。

我想知道python pandas库是否知道这种格式？如果没有，是否有另一种格式（优于csv）用于pandas和R之间的交换？

答案 0 :(得分：3)

我曾经认为你需要一个R实例反序列化R对象的时间最长 - 并且加载一个保存的R对象或一组对象等于读取（二进制，可能是压缩的）数据流并且序列化。

但是Davor证明我错了。在CPAN module Statistics-R-IO中提供了一个存在证明，它在Perl中执行此操作。大概有足够动力的人可以将其抽象为C库，其中许多其他项目（包括Python）都可以加载。或者用于保存R的Pandas数据。

更好的数据交换会很好。否则，您当然可以使用与语言无关的交换格式，例如Protocol Buffers。

（注意：CPAN.org现在似乎已经停止/放慢。如果需要，请使用Google缓存。）