您好我开始学习处理文本文件的pandas。到目前为止,我一直在使用numpy loadtxt,但是我遇到了一些由非常旧的程序生成的文本文件的问题(我无法替换):
[/home/Desktop/Flux_Calibration_Steps/stdWolf_wide_cr_f_a_bg] 1 4091 300.01 1.195 4240.778 7791.743 wolf wide
4330.00 1.3731E-13 20.000 88809.
4350.00 1.3480E-13 20.000 117447.
4370.00 1.5911E-13 20.000 162742.
4390.00 1.6972E-13 20.000 183740.
4510.00 1.8634E-13 20.000 863055.
4530.00 1.8641E-13 20.000 1056961.
4550.00 1.8308E-13 20.000 1215476.
4570.00 1.7654E-13 20.000 1352265.
[/home/Desktop/Flux_Calibration_Steps/stdF34_wide_cr_f_a_bg_] 1 4091 300.01 1.037 4241.941 7793.365 F34 broad
4400.00 2.8298E-13 50.000 1244259.
4450.00 2.6912E-13 50.000 1978971.
4500.00 2.5837E-13 50.000 3862673.
4550.00 2.4811E-13 50.000 5843749.
4600.00 2.3832E-13 50.000 7363710.
在这里,您可以获得4列表格中的数据。如您所见,有2个较长的行。这些代表来自不同来源的数据,代码堆叠起来。
我想从每个不同来源的第一和第二列中提取数据。另外,如果可能的话,我想从标题行中获取数据。
但是我不知道哪种方式是“蟒蛇”。我想知道是否有人会提供和建议如何识别每个“标题”行的索引而不进行循环。
一些警告:
1)在标题行和数据行中,列数是常量。但元素可能不同 2)几个数据源的行数可能不同
感谢您的任何建议。