我有一些连接在一起的数据框
X=[X_1, X_2, X_3, X_4, X_5, X_6, X_7, X_8, X_9, X_10]
我想问一下是否有可能在连接它们的位置保留一些索引,以便将它们折断并再次获得X_1,X_2等。
这样做的原因是,我正在为某些gps坐标创建唯一的类别变量(实际上,这些变量编码为geohash字符串)。下面的代码为X唯一类别的所有条目创建特定字符串(如果我没记错的话)。一个geohash看起来像u0m6cne,下面的代码会将其转换为一个分类数字,例如39。
Geo_as_Category=pd.Series(X['Geohash'], dtype="category")
X['GeohashFeature']=Geo_as_Category.cat.codes
此过程完成后,我想将X返回到初始数据集,例如X_1,X_2,依此类推。
有没有一种很好的方法来做到这一点而又不会使事情复杂化?
谢谢 亚历克斯
答案 0 :(得分:1)
keys
最简单的方法是使用字典
df = pd.concat(dict(enumerate(X)))
如果您想返回列表
[d.xs(k) for k, d in df.groupby(level=0)]