从大量模拟数据计算速度

时间:2012-12-14 14:08:17

标签: perl

我有水分子速度的模拟数据。数据格式如下。为了清晰起见,我想描述数据的格式,这很容易导致我想要计算的内容。

水分子由三个原子组成:氧(O)和两个氢(H)。在这里,我将它们命名为O,H1和H2。

下面的数据以行title 0和数字4335开头,表示它包含433​​5个原子(4335/3 = 1445个水分子)。

从第三行开始的前三个数字(0.0923365 0.0341984 -0.1248516)表示在三个笛卡尔方向Ox,Oy,Oz的氧(O)原子的速度。接下来的三个数字,在同一行代表氢的速度(H1)==> H1x,H1y,H1z。最后,第四行中的前三个数字代表氢气(H2)==>的速度。 H2X,H2Y,H2z。最后,在同一第四行中的以下三个数字代表氧原子的速度。

这些序列对2170行中的所有4335个原子进行,包括数据文件中的前两行,并从title 1开始重复以下部分。

title 0
4335  2.0001000e+04
 0.0923365   0.0341984  -0.1248516  -0.8946258   1.6688854   0.8259304
 0.2890579   0.8051153  -1.5612963   0.0625492  -0.1361579   0.2869132
 0.2343408  -0.0665305   1.0745378  -0.8375892   0.6953992   0.5149021
-0.1628550   0.0131844   0.0688080   0.2429340   0.2168210  -0.0289806
-0.3677613   0.2054004  -0.1511643  -0.3487551  -0.1454157   0.0801884
-0.9039297  -0.0682939  -0.2337404  -0.5605327  -0.0369157   0.2243892
-0.3100274  -0.2673132  -0.2093299   0.1975043  -0.4572202  -0.8410826
-0.6995287  -0.4123909   0.0649209  -0.1910519   0.2289656   0.2443295
-0.0279093   0.5790939  -0.0104249  -1.1961776  -0.5387340   0.1445187
-0.3188485   0.3789352  -0.0112114   0.7831523   0.6043882  -0.7131590
-0.7214440  -0.5358508  -0.3035673  -0.1549275  -0.1402387  -0.0101964
-0.2027608   1.5107149   0.2963312  -1.5104872  -0.1554981  -1.3323215
 0.1097982  -0.1553742   0.3803437   0.0816858   0.0265007   0.4215823
 0.1157368   0.2100116   0.4712551   0.1799426  -0.1260255  -0.2131755
 0.1811777  -0.9442581  -0.6036636   0.9681703  -0.1523646  -0.3502441
 0.0976771   0.0019619  -0.1832204  -0.0055989   0.2701100  -0.4416720
 0.8496723   0.4070951  -0.0819204   0.1156806  -0.1619873  -0.0016126
-0.4051959   0.4263505  -0.9460036   0.4412067   0.1002270   0.5864405
-0.3831136   0.3240860  -0.0005143  -0.5667163   0.2618876   0.0103317
-0.6442209   0.3965833  -0.0778050  -0.2404238  -0.1339887  -0.1662417
 0.3421198   0.7480828  -1.8316993  -0.4454920  -0.0499657  -0.1951254
-0.2895359  -0.1934811  -0.2674928   0.1255802   1.3522828  -0.2829485
-0.4129106  -0.6842645  -1.0147657  -0.1278501  -0.0597648  -0.1478294
-0.2519974   0.0665314  -0.0690079  -0.0480210  -0.1179547  -0.2091919
-0.1942484   0.2583650  -0.0734658  -0.1216313   0.5158040  -0.0676843
-0.3063602   0.8148463  -0.1959571  -0.1009838  -0.3394633  -0.0866587
 .
 .     (goes on until line 2170)
 .
 0.1028815  -0.0844088  -0.2156557  -0.1698745  -0.2018967  -0.3863209
 0.1793070  -0.1005802   0.1800752  -0.1404713   0.2216020   0.2236271
 0.5192825  -0.7398186   0.0418758   0.0347715  -0.3457840  -0.1300237
-0.3089482   1.1125441  -0.4020403   0.2739744  -0.9062766   0.0012294
 0.1498538   0.0883857  -0.0094638   0.0963565  -1.1027019   0.0115313
-0.0432824   0.3330713   0.0304943
title 1
4335  2.0002000e+04
-0.2082078   0.1774843  -0.1023302  -0.1100437   0.5973607   1.0627041
-0.2216015   0.0448885  -0.8415924   0.1691296   0.6008261  -0.0373434
 0.9387534  -0.3642305   0.6756270  -0.6000357   0.6632088   1.0567899
-0.3234407  -0.1781680  -0.1936070  -0.4799916  -0.1522612  -0.2347461
 0.1045985   0.1999704  -0.1482928  -0.0439331   0.0413923   0.1605458
 0.3403952  -0.2012104   0.4851457  -0.9665228   0.2202362   0.0046218
 .
 .   (goes on until line 2170)
 .   

我想要计算的是每个分子的合成速度,我想用Perl来做这个。算法以这种方式进行。

首先分别在Ox,Oy,Oz,H1x,H1y,H1z和H2x,H2y,H2z中存储氧气(O)和氢气(H1和H2)的速度。

接下来我们定义:

    velocity_x = Ox + Hx + Hx
    velocity_y = Oy + Hy + Hy
    velocity_z = Oz + Hz + Hz

最后计算

  resultant_velocity = sqrt(velocity_x**2 + velocity_y**2  + velocity_z**2)

并将“resul_velocity”存储到新文件中(该文件应为title_0.dat)。程序应计算文件中从title 1title 200的速度。

我是Perl的新手,但我想在Perl中执行此操作,因为我发现它非常有趣。我可以在Perl中编写简单的“读写”操作,但是不知道如何将值拆分并分配给变量并进行计算,尽管计算是高中标准。

#!/usr/bin/perl -w

$data_file="malto.dat";
open(DAT, $data_file) || die("Could not open file!");
@raw_data=<DAT>;
close(DAT);

while(<@raw_data>){
@columns=split /\s+/,$_; 
if($columns[0]=~ m/ATOM/){ 
print "$columns[5], $columns[6], $columns[7]\n";
    }
}

我希望得到专家的一些指导,这样我就可以在处理代码时增强对Perl的理解。

感谢任何帮助。 此致

3 个答案:

答案 0 :(得分:1)

以下是我的建议:将工作分解为小组件,并为工作中每个有意义的部分编写方法。即:

use strict;
use warnings;

main(@ARGV); # Pass data file name on command line. Don't hard-code it.

sub main {
    my $data_f = shift;
    open(my $data_h, '<', $data_f) or die "$!: $data_f";
    while (my $section = get_section($data_h)){
        # Also write methods that can be called here to make 
        # desired computations, print output, etc.
    }
}

sub get_section {
    # Takes a file handle.
    # Returns a hash reference containing all of the data
    # for an entire section of the file.
    my $h = shift;
    return if eof($h);
    chomp (my $title = <$h>);
    my ($n_atoms) = <$h> =~ /^(\d+)/;
    return {
        'title'     => $title,
        'n_atoms'   => $n_atoms,
        'molecules' => get_molecules($h, $n_atoms / 3),
    };
}

sub get_molecules {
    my @molecules;
    return \@molecules;
}

我没有写get_molecules()方法。它需要一个文件句柄和一个整数(N个分子)。它可以返回对数组数组或者哈希数组的引用,每个内部数组/哈希保存单个分子的信息。

答案 1 :(得分:1)

以下可能会对您有所帮助:

use strict;
use warnings;
use Math::Complex;

my $dataFile = 'malto.dat';

{
    local $/ = 'title ';
    open my $fh, '<', $dataFile or die $!;

    while (<$fh>) {
        chomp;

        my @data = split or next;

        my $titleNum     = 'Title ' . shift @data;
        my $atom         = shift(@data) . ' ' . shift @data;
        my $resultantVel = calcResultantVel( \@data );

        print $titleNum, "\n";
        print $atom,     "\n";
        print 'ResultantVel: ' . $resultantVel, "\n\n";
    }

    close $fh;
}

sub calcResultantVel {
    my ($dataRef) = @_;

    my ($velocity_x, $velocity_y, $velocity_z);

    while ( my @nums = splice( @$dataRef, 0, 9 ) ) {
        $velocity_x += $nums[0] + $nums[3] + $nums[6];
        $velocity_y += $nums[1] + $nums[4] + $nums[7];
        $velocity_z += $nums[2] + $nums[5] + $nums[8];
    }

    return sqrt( $velocity_x**2 + $velocity_y**2 + $velocity_z**2 );
}

单词和空格title用作记录分隔符,因此每次读取都会接收由title分隔的一大块数据。 chomp删除记录分隔符,然后记录在空格上为split

第0个元素是标题号,shift已关闭@data@data的第一个和第二个元素是原子计数,它们也被shift删除了。其余的数组元素是笛卡尔方向,对该数组的引用将发送到子例程calcResultantVel

子程序一次取一块九个元素:三个用于O原子,三个用于第一个H原子,三个用于第二个H原子,并根据您提供的定义保留运行总和。最后,返回合成速度。

以下是一些示例输出:

Title 0
4335 2.0001000e+04
ResultantVel: 13.2945751170603

Title 1
4335 2.0001000e+04
ResultantVel: 12.7696611061461

您可以直观地验证它是否正常工作。既然你“......可以在Perl中编写简单的'读写'操作......”,下一步就是让它将所需的结果写入文件。

希望这有帮助!

答案 2 :(得分:0)

感谢您的帮助和指导。我试图修改你的代码如下。它至少可以满足我的需求。

#!/usr/bin/perl
###############

#use strict;
#use warnings;
use Math::Complex;

open    OUTPUT, '>', "velocityOnly.dat" or die "Can't create filehandle: $!";

my $dataFile = 'velF1F2.vel';

{
local $/ = 'title ';
open my $FH, '<', $dataFile or die $!;

while (<$FH>) {
    chomp;

    my @data = split or next;

    my $titleNum     = 'Title ' . shift(@data);
    my $atom         = shift(@data) . ' ' . shift(@data);
    #my $resultantVel = calcResultantVel( \@data );

    #print OUTPUT "$titleNum", "\n";
print "$titleNum", "\n";

for my $i (1..1445)
{
    $j=(9*($i-1));  

   $velocity_x = $data[($j+0)] + $data[($j+3)] + $data[($j+6)];
   $velocity_y = $data[($j+1)] + $data[($j+4)] + $data[($j+7)];
   $velocity_z = $data[($j+2)] + $data[($j+5)] + $data[($j+8)];

   $velo = sprintf '%.3f',sqrt( $velocity_x**2 + $velocity_y**2 + $velocity_z**2 );
        chomp $velo;
        print   "$velo","\n";
        print   OUTPUT  "$velo\n";

    }

    #print 'ResultantVel: ' . $resultantVel, "\n\n";
    }

   close $FH;
   }

但我想通过添加一些其他功能来进一步扩展以进行一些复杂的计算。代码

在此之前,我需要一些关于将下面的代码放入子程序的指南。我有点迷失在这里。你的CODE实际上添加了所有的X,Y和Z,最后找到了速度。但我想要的不是那个。随后每9个值代表含有三个原子的水分子的坐标。

(数字1445是分子数。每个分子包含三个原子,每个原子有三个坐标。因此水分子有9个笛卡尔坐标。)

这里的i表示水分子的数量

for my $i (1..1445)
{
    $j=(9*($i-1));  

   $velocity_x = $data[($j+0)] + $data[($j+3)] + $data[($j+6)];
   $velocity_y = $data[($j+1)] + $data[($j+4)] + $data[($j+7)];
   $velocity_z = $data[($j+2)] + $data[($j+5)] + $data[($j+8)];

   $velo = sprintf '%.3f',sqrt( $velocity_x**2 + $velocity_y**2 + $velocity_z**2 );
        chomp $velo;
        print   "$velo","\n";
        print   OUTPUT  "$velo\n";

    }