由于一些新格式化和结构不良的数据文件,我遇到了一个有趣的问题。它们是文本文件,逗号分隔,包含多组数据,每组数据都有唯一的标题。最初我使用genFromTxt只读入一个带有一个标头的数据实例。现在有了多个实例,genFromTxt就无法处理它。什么是最好的方法来分割文件并将每个单独的实例提供给genFromTxt?这是该文件的一个示例。来自第一个实例的数据立即与第二个实例的标题对接。每个文件重复约20次。我还没有找到一个可以将它们分开的通用分隔符。
0.8 9999.0 999.0 999.0 999.0 9999.0 9999.0 999.0 999.0 999.0 9999.000 999.000 999.0 999.0 99999.0 9.0 9.0 9.0 9.0 9.0 9.0
0.5 9999.0 999.0 999.0 999.0 9999.0 9999.0 999.0 999.0 999.0 72.380 -7.761 999.0 999.0 99999.0 9.0 9.0 9.0 9.0 9.0 9.0
0.3 9999.0 999.0 999.0 999.0 9999.0 9999.0 999.0 999.0 999.0 9999.000 999.000 999.0 999.0 99999.0 9.0 9.0 9.0 9.0 9.0 9.0
0.0 9999.0 999.0 999.0 999.0 9999.0 9999.0 999.0 999.0 999.0 72.381 -7.760 999.0 999.0 99999.0 9.0 9.0 9.0 9.0 9.0 9.0
-1.0 906.7 20.0 18.9 92.8 -10.1 -3.7 10.7 70.0 999.0 72.380 -7.761 999.0 999.0 953.8 1.0 1.0 1.0 1.0 1.0 9.0
Data Type: AVAPS SOUNDING DATA, Channel 2/Descending
Project ID: DYNAMO
Release Site Type/Site ID: NOAA P3/N43RF 20111116I1
Release Location (lon,lat,alt): 072 12.04'E, 08 11.50'S, 72.201, -8.192, 966.4
UTC Release Time (y,m,d,h,m,s): 2011, 11, 16, 04:22:07
Reference Launch Data Source/Time: IWGADTS Format (IWG1)/04:22:07
Sonde Id: 110355308
System Operator/Comments: TMR/none, Good Drop
Post Processing Comments: Aspen Version 3.1; Created on 01 Feb 2012 23:18 UTC; Configuration research-dropsonde
/
/
Nominal Release Time (y,m,d,h,m,s):2011, 11, 16, 04:22:07
Time Press Temp Dewpt RH Ucmp Vcmp spd dir Wcmp Lon Lat Ele Azi Alt Qp Qt Qrh Qu Qv QdZ
sec mb C C % m/s m/s m/s deg m/s deg deg deg deg m code code code code code code
------ ------ ----- ----- ----- ------ ------ ----- ----- ----- -------- ------- ----- ----- ------- ---- ---- ---- ---- ---- ----
89.8 1011.6 27.3 23.9 81.0 9999.0 9999.0 999.0 999.0 999.0 9999.000 999.000 999.0 999.0 0.0 1.0 1.0 1.0 9.0 9.0 9.0