如何将数千个日期和ID分组到Pandas中用于机器学习的列中?

时间:2018-01-05 15:31:33

标签: pandas pandas-groupby

enter image description here enter image description here我有一个包含muliple列和行的大型数据框。它们按地理位置和日期分组。问题是我有太多的日期列。我想我需要进一步开发这个数据框,以便我有:" GeographyCode","奖项数量","中学阶段"," SCQF级"和" DateCode"作为单行。我不知道我的数据是否可用于Scikit Learn Linear Regression。请帮忙。

pivot02.columns

MultiIndex(等级= [['奖励数量'' SCQF等级','中学阶段'],[' 2002/2003& #39;,' 2003/2004',' 2004/2005',' 2005/2006',' 2006/2007',&# 39; 2007/2008',' 2008/2009',' 2009/2010',' 2010/2011',' 2011/2012&# 39;,' 2012/2013']],            labels = [[0,0,0,0,0,0,0,0,0,0,1,1,1,1,1,1,1,1,1,1,1,2,2, 2,2,2,2,2,2,2,2,2],[0,1,2,3,4,5,6,7,8,9,10,0,1,2, 3,4,5,6,7,8,9,10,0,1,2,3,4,5,6,7,8,9,10]],            names = [None,' DateCode'])

我已成功分组地理位置,奖励数量,' SCQF等级'中学阶段。但最终输出是一个多指数,我不知道我是否可以用于线性回归。机器学习可以吗?

0 个答案:

没有答案