R有自己的格式,比csv更有表现力(例如,了解因素)。扩展名通常是.Rdata,使用load
和save
函数从R操作。
我想知道python pandas库是否知道这种格式?如果没有,是否有另一种格式(优于csv)用于pandas和R之间的交换?
答案 0 :(得分:3)
我曾经认为你需要一个R实例反序列化R对象的时间最长 - 并且加载一个保存的R对象或一组对象等于读取(二进制,可能是压缩的)数据流并且序列化。
但是Davor证明我错了。在CPAN module Statistics-R-IO中提供了一个存在证明,它在Perl中执行此操作。 大概有足够动力的人可以将其抽象为C库,其中许多其他项目(包括Python)都可以加载。或者用于保存R的Pandas数据。更好的数据交换会很好。否则,您当然可以使用与语言无关的交换格式,例如Protocol Buffers。
(注意:CPAN.org现在似乎已经停止/放慢。如果需要,请使用Google缓存。)