如何从文本文件中提取数据集?

时间:2017-10-16 08:27:35

标签: sed extract

在Unix领域相当新,我目前正在尝试从文本文件中提取数据集。我尝试使用sed,grep,awk但它似乎只能用于提取线,但我想提取整个数据集......这是一个文件示例,我想从中提取2个数据集(后面的数据)线条“R.Time Intensity”)

[Header]
Application Name    LabSolutions
Version 5.87
Data File Name  C:\LabSolutions\Data\Antoine\170921_AC_FluoSpectra\069_WT3a derivatized lignin LiCl 430_GPC_FOREVER_430_049.lcd
Output Date 2017-10-12
Output Time 12:07:32

[Configuration]
Instrument Name BOTAN127-Instrument1
Instrument #    1
Line #  1
# of Detectors  3
Detector ID Detector A  Detector B  PDA
Detector Name   Detector A  Detector B  PDA
# of Channels   1   1   2

[LC Chromatogram(Detector A-Ch1)]
Interval(msec)  500
# of Points 9603
Start Time(min) 0,000
End Time(min)   80,017
Intensity Units mV
Intensity Multiplier    0,001
Ex. Wavelength(nm)  405
Em. Wavelength(nm)  430
R.Time (min)    Intensity
0,00000 -709779
0,00833 -709779
0,01667 17
0,02500 3
0,03333 7
0,04167 19
0,05000 9
0,05833 5
0,06667 2
0,07500 24
0,08333 48

[LC Chromatogram(Detector B-Ch1)]
Interval(msec)  500
# of Points 9603
Start Time(min) 0,000
End Time(min)   80,017
Intensity Units mV
Intensity Multiplier    0,001
R.Time (min)    Intensity
0,00000 149
0,00833 149
0,01667 -1

我非常感谢任何想法。提前致谢。 安托

3 个答案:

答案 0 :(得分:0)

 awk '/R.Time/,/LC/' file|grep -v -E "R.Time|LC"

grep part将删除作为awk输出的一部分的R.Time和LC行

答案 1 :(得分:0)

awk '/^[^0-9]/&&d{d=0} /R.Time/{d=1}d' file

简要说明,

  • d设置为标志以确定是否打印行
  • /^[^0-9]/&&d{d=0}:如果正则表达式^[^0-9]匹配&& d==1,已停用d
  • /R.Time/{d=1}:if string" R.Time"已搜索,已启用d

答案 2 :(得分:0)

我认为这是sed的工作。

sed '/R.Time/!d;:A;N;/\n$/!bA' infile