我的熊猫数据框中的传感器数据如下:
Timestamp 1014.temperature 1014.humidity 1015.temperature 1015.humidity 1016.temperature 1016.humidity
2017-10-01 00:00:00 11.396667 92.440806 10.513333 92.204295 11.040000 92.959605
SensorID
由每列中点之前的4位数字给出。 Timestamp
为数据建立索引。数据将继续运行多个时间戳和SensorID。
我该怎么做以检索每一列中的SensorID
来创建一个新列,以使我的数据框看起来像这样:
Timestamp SensorID Temperature Humidity
2017-10-01 00:00:00 1014 11.396667 92.440806
2017-10-01 00:00:00 1015 10.513333 92.204295
2017-10-01 00:00:00 1016 11.040000 92.959605
谢谢。
答案 0 :(得分:5)
列中MultiIndex
的第一个str.split
并由第一级的DataFrame.stack
重塑,最后DataFrame.reset_index
的rename
重塑:
#if Timestamp is column
#df = df.set_index('Timestamp')
df.columns = df.columns.str.split('.', expand=True)
df = df.stack(level=0).reset_index().rename(columns={'level_1':'SensorID'})
print (df)
Timestamp SensorID humidity temperature
0 2017-10-01 00:00:00 1014 92.440806 11.396667
1 2017-10-01 00:00:00 1015 92.204295 10.513333
2 2017-10-01 00:00:00 1016 92.959605 11.040000