我有一个地震数据要读取到Pandas数据框中。每次地震的数据分布在5条固定格式的线路上,而5条线路中的每条线路的格式都不同。有些字段包含可变的空格,所以我不能只做定界读取。
是否有一种优雅的方法可以通过read_fwf(或其他方法)进行解析?我认为chunksize = 1的嵌套循环可能有效,但不是很干净。或者,我可以将文件重新格式化为将每5行的块划分为一行。但我宁愿使用原始文件。
这里是他第一次地震:
MLI 1976/01/01 01:29:39.6 -28.61 -177.64 59.0 6.2 0.0 KERMADEC ISLANDS REGION
M010176A B: 0 0 0 S: 0 0 0 M: 12 30 135 CMT: 1 BOXHD: 9.4
CENTROID: 13.8 0.2 -29.25 0.02 -176.96 0.01 47.8 0.6 FREE O-00000000000000
26 7.680 0.090 0.090 0.060 -7.770 0.070 1.390 0.160 4.520 0.160 -3.260 0.060
V10 8.940 75 283 1.260 2 19 -10.190 15 110 9.560 202 30 93 18 60 88