更新

Question

版本信息：

print(sys.version)
3.5.1 |Anaconda 4.1.0 (64-bit)| (default, Jun 15 2016, 15:29:36) [MSC v.1900 64 bit (AMD64)]

我的数据框中的列看起来像这样（纬度和经度是多级列）：

+------------+---------------+--------------+--------------+
| CustomerId | StreetAddress |   Latitude   |   Longitude  | 
+------------+---------------+-------+------+-------+------+
|                            | count | mean | count | mean |
+----------------------------+-------+------+-------+------+

我想得到这个：

+------------+---------------+-----------+----------+-----------+----------+
| CustomerId | StreetAddress | Lat_count | Lat_mean | Lon_count | Lon_mean | 
+------------+---------------+-----------+----------+-----------+----------+

我试过了：

newColumns = ['CustomerId','StreetAddress','Lat_count','Lat_mean','Lon_count','Lon_mean']
data2 = data1.reindex(columns=newColumns)

但那绝对没用！我最终得到了一些疯狂的多级列，newColumns中每个字符串的每个字母都是一个新级别。

更新

这是我的专栏

data1.columns.to_series()

CustomerId                  (CustomerId, )
StreetAddress            (StreetAddress, )
Latitude       count     (Latitude, count)
               mean       (Latitude, mean)
Longitude      count    (Longitude, count)
               mean      (Longitude, mean)

Answer 1

这样可以解决问题：

data2 = pd.DataFrame(data1.values, columns=newColumns)

还有这个：

data1.columns = newColumns

如何重新索引多级列

更新

1 个答案: