从制表符分隔文件中提取最后一列

时间:2012-12-05 20:15:05

标签: linux perl unix awk

我在文本文件中有以下数据。

10993   39750   11002
10993   39751   10995
10993   39752   48981
10993   39750   344417  79600
10985   39750   344417  475879
110010  39750   59816

我可以使用哪些unix命令来执行“SELECT LAST_COLUMN WHERE FIRST_COLUMN ='10993'”之类的操作 然后结果将是:

11002
10995
48981
79600

5 个答案:

答案 0 :(得分:8)

不了解perl,但此处是awk解决方案:

awk '$1==10993 {print $NF}' file
11002
10995
48981
79600

答案 1 :(得分:1)

Perl有一个非常简单的autosplit mode,它允许您解决问题的简单方法。

  

<强> -a

     与-n-p一起使用时,

会启用自动分割模式。对@F数组的隐式拆分命令是-n-p生成的隐式while循环中的第一个内容。

perl -ane 'print pop(@F), "\n";'
     

相当于

while (<>) {
    @F = split(' ');
    print pop(@F), "\n";
}
     

可以使用-F指定备用分隔符。

在你的案例中使用它看起来像

$ perl -lane 'print $F[-1] if $F[0] == 10993' input
11002
10995
48981
79600

答案 2 :(得分:1)

我不认为当你可以使用命令行时,你应该更喜欢它的脚本。

perl -F -lane 'if($F[0]==10993){print $F[(scalar @F)-1]}' your_file

下面测试:

> cat temp
10993   39750   11002
10993   39751   10995
10993   39752   48981
10993   39750   344417  79600
10985   39750   344417  475879
110010  39750   59816
> perl -F -lane 'if($F[0]==10993){print $F[(scalar @F)-1]}' temp
11002
10995
48981
79600

答案 3 :(得分:0)

许多可能的方法之一是awk:

awk '-F\t' 'if ($1 == "wanted-first-column-value") { print $NF }'

答案 4 :(得分:0)

看到你用perl标记了你的问题,这里有一些例子:

在perl中硬编码:

#!/usr/bin/perl
use warnings;
use strict;

open INFILE,"<somefilename";
while (<INFILE>)
{
    my @cols = split(/\s+/,$_);
    if ($cols[0] eq '10993') {      print $cols[-1] . "\n"; }
}

再次使用perl,但是从STDIN取而代之,所以你可以只输出输出:

#!/usr/bin/perl
use warnings;
use strict;

while (<>)
{
    my @cols = split(/\s+/,$_);
    if ($cols[0] eq '10993') {      print $cols[-1] . "\n"; }
}

perl中的另一个例子,将文件名作为第一个争论,并将所需的第一个字段作为第二个争论:

#!/usr/bin/perl
use warnings;
use strict;

unless ($ARGV[0])    { die "No filename specified\n" }
unless ($ARGV[1])    { die "No required field specified\n" }
unless (-e $ARGV[0]) { die "Can't find file $ARGV{0]\n" }
open INFILE,"<ARGV{0]";
while (<INFILE>)
{
    my @cols = split(/\s+/,$_);
    if ($cols[0] eq $ARGV[1]) {     print $cols[-1] . "\n"; }
}

然而,使用awk可能更容易:

awk '{if ($1 == 10993) {print $NF}}' someFileName