基于第二列值

时间:2018-05-31 15:14:50

标签: python pandas csv

我正在解释和创建类似标题的数据框。但不知道如何处理每行上的不同标题。

我有一个大文本文件说abcde.txt

文件中显示的数据格式如下:(第二列值说明格式的其余部分和不同列#2类型的标题名称不同。)

DATA, 0 , timestamp, (set of 5 numbers(A,B,C,D,E) data repeated multiple times.)
DATA,1 timestamp (set of 4 numbers (AA, BB,CC,DD) repeated  multiple times)
DATA,2, timestamp (set of 3 numbers (AAA, BBB,CCC) repeated multiple times)
DATA, 3 , timestamp (set of 6 numbers repeated multiple times ))

第2列值最大值为5.文件有多行相同列类型。

示例:

DATA, 0, A1,B1, C1,D1,E1, A2, B2,C2,D2,E2, A3,B3,C3,D3,D3…
DATA, 1, AA1, BB1,CC1, DD1, AA2, BB2, CC2, DD2, AA3, BB3, CC3, DD3 ….
DATA, 2, AAA1, BBB2,CCC2, AAA1, BBB2,CCC2, AAA1, BBB2,CCC2, AAA1, BBB2,CCC2
DATA, 0, A4,B4, C4,D4,E4, A5, B5,C5,D5,E5, A6,B6,C6,D6,E6…

:::::

编辑:

我试着进一步解释一下问题

所以我想根据第二列的值(0到5)来制作单独的数据帧进行分析。

如果您在示例中看到第二列的值为== 0(第1行),则这是5个标头格式,因此我想准备5个值并在数据帧中创建一行并读取下一个5个值的值相同的行并使用重复的时间戳将行插入数据框。因此,如果重复5次设置的10次,那么它将是10X(5 + 1(对于时间戳))维度数据帧。我必须对第二列具有值== 0的所有行重复此操作,并将其添加到数据帧以生成第二列== 0的完整数据帧。

 Something like this: (this is the data frame where second column value ==0)
Header:             timestamp      A    B   C    D    E 
                    12345          A1   B1  C1   D1   E1
                    12345          A2   B2  C2   D2   E2
                    12345          A3   B3  C3   D3   E3
(new line in file)  14567          A4   B4  C4   D4   E4
                    14567          A5   B5  C5   D5   E5
                    14567          A6   B6  C6   D6   E6
…….
Same with second column value==1 and so on.
I am referring data frame as 2D array.

0 个答案:

没有答案