Question

我有一个大型csv文件，其中包含对下面数组的名称和索引进行编码的列。例如：

time, dataset1[0], dataset1[1], dataset1[2], dataset2[0], dataset2[1], dataset2[2]\n
0, 43, 35, 29, 21, 59, 39\n
1, 21, 59, 39, 43, 35, 29\n

你明白了（显然阵列中有更多的数据）。

任何想法如何轻松地将其解析/剥离成有效的数据帧？

[编辑]

理想情况下，我正在追求这样的结构：

    time  dataset1   dataset2
0    0   [43,35,29]  [21,59,39]
1    1   [21,59,39]  [43,35,29]

其中索引已从标签中剥离并转换为nparray索引。

Answer 1

from pandas import read_csv
df = read_csv('data.csv')

print df

作为输出：

>>> 
   time   dataset1[0]   dataset1[1]   dataset1[2]   dataset2[0]   dataset2[1]  \
0     0            43            35            29            21            59   
1     1            21            59            39            43            35   

   dataset2[2]  
0           39  
1           29

按字符串索引数据

1 个答案: