使用pandas打开文本文件,其中某些行具有不同的格式

时间:2015-05-20 09:09:31

标签: python numpy text pandas genfromtxt

您好我开始学习处理文本文件的pandas。到目前为止,我一直在使用numpy loadtxt,但是我遇到了一些由非常旧的程序生成的文本文件的问题(我无法替换):

[/home/Desktop/Flux_Calibration_Steps/stdWolf_wide_cr_f_a_bg] 1 4091 300.01 1.195  4240.778  7791.743 wolf wide
 4330.00   1.3731E-13   20.000       88809.
 4350.00   1.3480E-13   20.000      117447.
 4370.00   1.5911E-13   20.000      162742.
 4390.00   1.6972E-13   20.000      183740.
 4510.00   1.8634E-13   20.000      863055.
 4530.00   1.8641E-13   20.000     1056961.
 4550.00   1.8308E-13   20.000     1215476.
 4570.00   1.7654E-13   20.000     1352265.
[/home/Desktop/Flux_Calibration_Steps/stdF34_wide_cr_f_a_bg_] 1 4091 300.01 1.037  4241.941  7793.365 F34 broad
 4400.00   2.8298E-13   50.000     1244259.
 4450.00   2.6912E-13   50.000     1978971.
 4500.00   2.5837E-13   50.000     3862673.
 4550.00   2.4811E-13   50.000     5843749.
 4600.00   2.3832E-13   50.000     7363710.

在这里,您可以获得4列表格中的数据。如您所见,有2个较长的行。这些代表来自不同来源的数据,代码堆叠起来。

我想从每个不同来源的第一和第二列中提取数据。另外,如果可能的话,我想从标题行中获取数据。

但是我不知道哪种方式是“蟒蛇”。我想知道是否有人会提供和建议如何识别每个“标题”行的索引而不进行循环。

一些警告:

1)在标题行和数据行中,列数是常量。但元素可能不同 2)几个数据源的行数可能不同

感谢您的任何建议。

0 个答案:

没有答案