我正在解释和创建类似标题的数据框。但不知道如何处理每行上的不同标题。
我有一个大文本文件说abcde.txt
文件中显示的数据格式如下:(第二列值说明格式的其余部分和不同列#2类型的标题名称不同。)
DATA, 0 , timestamp, (set of 5 numbers(A,B,C,D,E) data repeated multiple times.)
DATA,1 timestamp (set of 4 numbers (AA, BB,CC,DD) repeated multiple times)
DATA,2, timestamp (set of 3 numbers (AAA, BBB,CCC) repeated multiple times)
DATA, 3 , timestamp (set of 6 numbers repeated multiple times ))
第2列值最大值为5.文件有多行相同列类型。
示例:
DATA, 0, A1,B1, C1,D1,E1, A2, B2,C2,D2,E2, A3,B3,C3,D3,D3…
DATA, 1, AA1, BB1,CC1, DD1, AA2, BB2, CC2, DD2, AA3, BB3, CC3, DD3 ….
DATA, 2, AAA1, BBB2,CCC2, AAA1, BBB2,CCC2, AAA1, BBB2,CCC2, AAA1, BBB2,CCC2
DATA, 0, A4,B4, C4,D4,E4, A5, B5,C5,D5,E5, A6,B6,C6,D6,E6…
:::::
编辑:
我试着进一步解释一下问题
所以我想根据第二列的值(0到5)来制作单独的数据帧进行分析。
如果您在示例中看到第二列的值为== 0(第1行),则这是5个标头格式,因此我想准备5个值并在数据帧中创建一行并读取下一个5个值的值相同的行并使用重复的时间戳将行插入数据框。因此,如果重复5次设置的10次,那么它将是10X(5 + 1(对于时间戳))维度数据帧。我必须对第二列具有值== 0的所有行重复此操作,并将其添加到数据帧以生成第二列== 0的完整数据帧。
Something like this: (this is the data frame where second column value ==0)
Header: timestamp A B C D E
12345 A1 B1 C1 D1 E1
12345 A2 B2 C2 D2 E2
12345 A3 B3 C3 D3 E3
(new line in file) 14567 A4 B4 C4 D4 E4
14567 A5 B5 C5 D5 E5
14567 A6 B6 C6 D6 E6
…….
Same with second column value==1 and so on.
I am referring data frame as 2D array.