我在python中有一个脚本,它加载.RData并读取它,然后将其写入excel文件。不幸的是,一个表包含11个变量和144个具有混合类型的对象(IntVector,FactorVector,Float Vector,Float Vector,等等)
当表格写入Excel时,将保留列名称和数据,但是作为四级FactorVector的列除外。而不是返回与四个级别相关联的元数据(a,a,a,a,b,b,b,b,c,c,c,d,d,d,d ......等),返回与每个级别相关的整数值(1,1,1,1,2,2,2,2,3,3,3,3,4,4,4,4 ......等)
我在rpy2 sourceforge website上找到了这个,这几乎解释了我的问题。
由于FactorVector是一个带有附加元数据的IntVector(级别),因此从IntVector获取项目时,获取Python样式的项目没有改变。结果就是失去了有关关卡的信息。
在下面继续讨论使用级别,此时我迷失了我应该做什么或使用什么来保持元素级别对于所讨论的FactorVector变量完整。
我认为有某种rpy2.robjects" switch"它会在转换为python时保留这些元数据吗?应用此方法最有效的方法是什么?谢谢!
答案 0 :(得分:1)
为rpy2-2.6.0中的pandas DataFrame定制的转换层客户应该注意将R因子转换为Pandas因子。