Perl套接字解析来自网络流的数据包

时间:2016-05-15 16:22:13

标签: perl sockets parsing stream

我试图找出一种使用perl解析数据流的正确方法。 我已经阅读了很多例子,文档和问题,但是找不到我如何能够基本上删除一个"包#34;从数据流中处理它。 情况就是这样:   - 从某个IP到IP和端口的数据流   - 流包含一些乱码,然后介于和之间的数据与分号分隔

到目前为止,我的尝试是让Socket监听端口并处理$ data var:

#!/usr/bin/perl
    use IO::Socket::INET;
    # auto-flush on socket
    $| = 1;

# creating a listening socket
my $socket = new IO::Socket::INET (
    LocalHost => '127.0.0.1',
    LocalPort => '7070',
    Proto => 'tcp',
    Listen => 5,
    Reuse => 1
);
die "cannot create socket $!\n" unless $socket;
print "server waiting for client connection on port 7070 \n";

while(1)
{
    # waiting for a new client connection
    my $client_socket = $socket->accept();

    # get information about a newly connected client
    my $client_address = $client_socket->peerhost();
    my $client_port = $client_socket->peerport();
    print "connection from $client_address:$client_port\n";

    # read up to 1024 characters from the connected client
    my $data = "";
    $client_socket->recv($data, 1024);
    print "received data: $data\n";

    @data_array = split(/;/,$data);
    foreach (@data_array) {
      print "$_\n";
    }

    # write response data to the connected client
    $data = "ok";
    $client_socket->send($data);

    # notify client that response has been sent
    shutdown($client_socket, 1);
}

$socket->close();

这有效,但据我所知,这会将整个流放到最大尺寸然后处理。

我的问题: 如何识别我需要的部分(开始 - 结束),处理然后继续下一部分?

2 个答案:

答案 0 :(得分:3)

我从未理解为什么人们使用recv从流套接字中读取。

通常,阅读循环如下所示:

my $buf = '';
while (1) {
   my $rv = sysread($socket, $buf, 64*1024, length($buf));
   if (!defined($rv)) {
      die("Can't read from socket: $!\n");
   }

   if (!$rv) {
      die("Can't read from socket: Premature EOF\n") if length($buf);
      last;
   }

   while (my $msg = defined(check_for_full_message_and_extract_it_from_buf($buf))) {
      process_msg($msg);
   }
}

(请记住,只要有一些数据,sysread就会返回,即使数据少于请求的数据。)

例如,Sentinel终止数据的内部循环如下所示:

   while ($buf =~ s/^(.*)\n//) {
      process_msg("$1");
   }

例如,长度为前缀的块的内部循环如下所示:

   while (1) {
      last if length($buf) < 4;

      my $len = unpack('N', $buf);
      last if length($buf) < 4+$len;

      substr($buf, 0, 4, '');
      my $msg = substr($buf, 0, $len, '');
      process_msg($msg);
   }

如果你是特殊情况,你将从你想要忽略的开始$buf中删除任何数据,直到你到达你感兴趣的部分,然后你开始提取这些项目你感兴趣的。这很模糊,但我对协议的工作只有模糊的描述。

答案 1 :(得分:0)

我通过使用原始代码并添加:

解决了这个问题
{{1}}

我仍然需要实现我检查块读取是否具有下一条消息的一部分的部分,但我会想出来。 谢谢你的帮助!