我有一个大型csv文件,其中包含对下面数组的名称和索引进行编码的列。例如:
time, dataset1[0], dataset1[1], dataset1[2], dataset2[0], dataset2[1], dataset2[2]\n
0, 43, 35, 29, 21, 59, 39\n
1, 21, 59, 39, 43, 35, 29\n
你明白了(显然阵列中有更多的数据)。
任何想法如何轻松地将其解析/剥离成有效的数据帧?
[编辑]
理想情况下,我正在追求这样的结构:
time dataset1 dataset2
0 0 [43,35,29] [21,59,39]
1 1 [21,59,39] [43,35,29]
其中索引已从标签中剥离并转换为nparray索引。
答案 0 :(得分:2)
from pandas import read_csv
df = read_csv('data.csv')
print df
作为输出:
>>>
time dataset1[0] dataset1[1] dataset1[2] dataset2[0] dataset2[1] \
0 0 43 35 29 21 59
1 1 21 59 39 43 35
dataset2[2]
0 39
1 29