Question

我有一份清单清单。最外面的列表长度为20（单独的类别）。中间列表具有可变长度（时间戳列表）。内部列表的长度为5（每个时间戳分开）。例如：

sTimestamps[0][:5][:] = 

[['Tue', 'Feb', '7', '10:06:30', '2017'],
 ['Tue', 'Feb', '7', '10:07:06', '2017'],
 ['Tue', 'Feb', '7', '10:07:40', '2017'],
 ['Tue', 'Feb', '7', '10:12:36', '2017'],
 ['Tue', 'Feb', '7', '10:13:24', '2017']]

我还有一个名为categories的大小为2的列表字符串，其中包含类别名称，其中每个索引对应于最外面列表的20个索引的相同索引号。

如何将其转换为pandas数据框，其中列是时间戳的5个组成部分，另外还有第6个用于指定类别名称的列？

我可以为两个嵌套的列表执行此操作，但这个三个嵌套的列表给了我很多困难。

Answer 1

sTimeStamps = [
    [['Tue', 'Feb', '7', '10:06:30', '2017'],
     ['Tue', 'Feb', '7', '10:07:06', '2017'],
     ['Tue', 'Feb', '7', '10:07:40', '2017'],
     ['Tue', 'Feb', '7', '10:12:36', '2017'],
     ['Tue', 'Feb', '7', '10:13:24', '2017']],
    [['Tue', 'Feb', '7', '10:06:30', '2017'],
     ['Tue', 'Feb', '7', '10:07:06', '2017'],
     ['Tue', 'Feb', '7', '10:07:40', '2017']],
    ]

categories = ['cat%s' %i for i in range(20)]

pd.concat([pd.DataFrame(d) for d in sTimeStamps], keys=categories)

          0    1  2         3     4
cat0 0  Tue  Feb  7  10:06:30  2017
     1  Tue  Feb  7  10:07:06  2017
     2  Tue  Feb  7  10:07:40  2017
     3  Tue  Feb  7  10:12:36  2017
     4  Tue  Feb  7  10:13:24  2017
cat1 0  Tue  Feb  7  10:06:30  2017
     1  Tue  Feb  7  10:07:06  2017
     2  Tue  Feb  7  10:07:40  2017

pandas数据帧列表列表

1 个答案: