excel中的凌乱数据:使用pandas导入;列中出现多次变量

时间:2015-07-29 08:23:47

标签: python pandas

我确实有一个excel文件,其中包含由愚蠢的导出函数生成的最多100个测量值。每个测量包含200行:

Name1                                      Name2
' some other stuff related to the measurements'    
v    Qv    vm    qlnv    'empty column'    v    Qv    vm    qlnv
1    2     3    4                          5    6     7     8     

我确实导入了它:

df = pd.read_excel('data.xls',skiprows = 2, indexcol=None)

之后

df_1500.dropna(axis=1, inplace = True)
df_1500.columns

给了我:

Index([ u'v', u'Qv', u'vm', u'qlnv', u'v.1', u'Qv.1', u'vm.1', u'qlnv.1'])

我想重塑数据框,如:

name    v    Qv    vm    qlnv
1       1    2     3     4
2       5    6     7     8

我怎么能这样做?是否可以使用csv解析器的功能来完成这项工作?

1 个答案:

答案 0 :(得分:0)

你可以在numpy的帮助下获得这个效果。 df表示您的数据帧,结果为一行。我假设每行有4个功能。

import numpy as np
pd.DataFrame(np.array(df).reshape(df.shape[0]*df.shape[1]/4,4))