Question

我确实有一个excel文件，其中包含由愚蠢的导出函数生成的最多100个测量值。每个测量包含200行：

Name1                                      Name2
' some other stuff related to the measurements'    
v    Qv    vm    qlnv    'empty column'    v    Qv    vm    qlnv
1    2     3    4                          5    6     7     8

我确实导入了它：

df = pd.read_excel('data.xls',skiprows = 2, indexcol=None)

之后

df_1500.dropna(axis=1, inplace = True)
df_1500.columns

给了我：

Index([ u'v', u'Qv', u'vm', u'qlnv', u'v.1', u'Qv.1', u'vm.1', u'qlnv.1'])

我想重塑数据框，如：

name    v    Qv    vm    qlnv
1       1    2     3     4
2       5    6     7     8

我怎么能这样做？是否可以使用csv解析器的功能来完成这项工作？

Answer 1

你可以在numpy的帮助下获得这个效果。 df表示您的数据帧，结果为一行。我假设每行有4个功能。

import numpy as np
pd.DataFrame(np.array(df).reshape(df.shape[0]*df.shape[1]/4,4))

excel中的凌乱数据：使用pandas导入;列中出现多次变量

1 个答案: