Question

我正在尝试获取一组数据，并用另一组数据减去该数据中的每个值。

例如：

Data set one (1, 2, 3)
Data set two (1, 2, 3, 4, 5)

所以我应该得到(1 - (1 .. 5))然后(2 - (1..5))等等。

我目前有：

#!/usr/bin/perl
use strict;
use warnings;

my $inputfile = $ARGV[0];

open( INPUTFILE, "<", $inputfile ) or die $!;

my @array = <INPUTFILE>;

my $protein = 'PROT';
my $chain   = 'P';
my $protein_coords;

for ( my $line = 0; $line <= $#array; ++$line ) {
    if ( $array[$line] =~ m/\s+$protein\s+/ ) {
        chomp $array[$line];
        my @splitline = ( split /\s+/, $array[$line] );
        my %coordinates = (
            x => $splitline[5],
            y => $splitline[6],
            z => $splitline[7],
        );
        push @{ $protein_coords->[0] }, \%coordinates;
    }
}

print "$protein_coords->[0]->[0]->{'z'} \n";

my $lipid1 = 'MEM1';
my $lipid2 = 'MEM2';
my $lipid_coords;

for ( my $line = 0; $line <= $#array; ++$line ) {
    if ( $array[$line] =~ m/\s+$lipid1\s+/ || $array[$line] =~ m/\s+$lipid2\s+/ ) {
        chomp $array[$line];
        my @splitline = ( split /\s+/, $array[$line] );
        my %coordinates = (
            x => $splitline[5],
            y => $splitline[6],
            z => $splitline[7],
        );
        push @{ $lipid_coords->[1] }, \%coordinates;
    }
}

print "$lipid_coords->[1]->[0]->{'z'} \n";

我试图将$protein_coords->[0]->[$ticker]->{'z'}中的每个值减去$lipid_coords->[1]->[$ticker]->{'z'}中的每个值。

我的总体目标是在等式(z2-z1)^2中找到d = sqrt((x2-x1)^2+(y2-y1)^2-(z2-z1)^2)。我想如果我能做到这一次，那么我也可以为X和Y做到这一点。从技术上讲，我试图找到PDB文件中每个原子与同一PDB中每个脂质原子之间的距离，并打印距离小于5A的ResID。

Answer 1

要迭代两个数组的所有组合，只需嵌入两个for循环：

use strict;
use warnings;

my @dataone = (1, 2, 3);
my @datatwo = (1, 2, 3, 4, 5);

for my $one (@dataone) {
    for my $two (@datatwo) {
        print "$one - $two\n";
    }
}

输出：

Answer 2

这将为您提供从我认为是您所要求的方式中减去第1组中每个元素的第2组中每个元素的结果。

#!/usr/bin/perl

use strict;
use warnings;

my @set1 = (1, 2, 3);
my @set2 = (1, 2, 3, 4, 5);

my @set3 = ();
for my $val (@set1) {
    push @set3, map { $val - $_ } @set2;
}

local $" = ', ';
print "@set3\n";

system 'pause';

结果将是一个包含（1 - （1..5），2 - （1..5），3 - （1..5））的数组。

脚本运行后@ set3的内容：

0, -1, -2, -3, -4, 1, 0, -1, -2, -3, 2, 1, 0, -1, -2

所有其他蛋白质和脂质的东西都是我的头脑，但我希望这至少有点帮助。您现在应该有一个包含减去的元素的数组，您可以使用这些元素来获得其余的结果！

编辑：

可以用这一个衬里替换循环：）

my @set3 = map { my $v = $_; map { $v - $_ } @set2 } @set1;

地图是一个非常漂亮的功能！

Answer 3

最简单的方法是在进行文件二时进行计算：

for (my $line = 0; $line <= $#array; ++$line) {
    if (($array[$line] =~ m/\s+$lipid1\s+/) | ($array[$line] =~ m/\s+$lipid2\s+/)) {  
        chomp $array[$line];
        my @splitline = (split /\s+/, $array[$line]);
        my %coordinates = (x => $splitline[5],
                           y => $splitline[6],
                           z => $splitline[7],
                          );
        push @{$lipid_coords->[1]}, \%coordinates;

        # go through each of the sets of protein coors in your array...
        for my $p (@{$protein_coords->[0]}) {
            # you can store this value however you want...
            my $difference = $protein_coords->[0][$p]{z} - $coordinates{z};
        }
    }
}

如果我是你，我会使用某种形式的唯一标识符来允许我访问每个组合的数据 - 例如构建$difference->{<protein_id>}{<lipid_id>} = <difference>形式的哈希。

对两个数组中的每个变量组合执行一个函数

3 个答案:

编辑：