phpredis管道是否与使用协议进行大量插入相同?

时间:2013-09-23 11:37:35

标签: php insert redis phpredis

我正在将我的网站的某些部分从关系数据库移动到Redis,并且需要在很短的时间内插入数百万个密钥。

在我的情况下,数据必须首先从MySQL中提取,由PHP准备,然后添加到相应的排序集(时间作为分数+ ID作为值)。目前我正在使用带有Redis::PIPELINE参数的phpredis多方法的冒险。尽管有明显的速度提升,但在进行导入时,结果却阻止了读取并减慢了加载时间。

所以问题出现了 - 在phpredis中使用管道,等同于http://redis.io/topics/mass-insert中描述的大量插入


以下是一个例子:

  • phpredis 方式:

    <?php
    
    // All necessary requires etc.
    $client = Redis::getClient();    
    
    $client->multi(Redis::PIPELINE); // OR $client->pipeline();
    $client->zAdd('key', 1, 2);
    ...
    $client->zAdd('key', 1000, 2000);
    $client->exec();
    
  • 来自redis.io的
  • vs 协议

    cat data.txt | redis-cli --pipe
    

1 个答案:

答案 0 :(得分:7)

我是phpredis的贡献者之一,所以我可以回答你的问题。简短的回答是它不一样,但我会提供更多细节。

将phpredis置于Redis::PIPELINE模式时会发生什么,而不是在调用命令时发送命令,而是将其放入“待发送”命令列表中。然后,一旦调用exec(),就会创建一个包含所有命令的大命令缓冲区并发送给Redis。

命令全部发送后,phpredis会根据每个命令规范读取每个回复并打包结果(例如HMGET调用作为关联数组返回等。)


phpredis中的流水线操作的性能实际上非常好,并且应该足以满足几乎所有用例。话虽这么说,你仍在通过PHP处理每个命令,这意味着你将通过为每个命令调用phpredis扩展本身来支付函数调用开销。此外,phpredis将花时间处理和格式化每个回复。

如果您的用例需要将大量数据导入Redis,特别是如果您不需要处理每个回复(而只是想知道所有命令都已处理),那么批量导入方法就是这样去吧。

我实际上在这里创建了一个项目: https://github.com/michael-grunder/redismi

此扩展背后的想法是您使用命令调用它,然后将缓冲区保存到磁盘,该磁盘将采用原始Redis协议并与cat buffer.txt | redis-cli --pipe样式插入兼容。

有一点需要注意的是,目前你不能简单地用RedisMI对象调用替换任何给定的phpredis调用,因为命令被处理为变量参数调用(如hiredis),这对大多数都有效,但不是全部phpredis命令。

以下是一个如何使用它的简单示例:

<?php
$obj_mi = new RedisMI();

// Some context we can pass around in RedisMI for whatever we want
$obj_context = new StdClass();
$obj_context->session_id = "some-session-id";

// Attach this context to the RedisMI object
$obj_mi->SetInfo($obj_context);

// Set a callback when a buffer is saved
$obj_mi->SaveCallback(
    function($obj_mi, $str_filename, $i_cmd_count) {
        // Output our context info we attached
        $obj_context = $obj_mi->GetInfo();
        echo "session id: " . $obj_context->session_id . "\n";

        // Output the filename and how many commands were sent
        echo "buffer file: " . $str_filename . "\n";
        echo "commands   : " . $i_cmd_count . "\n";
    }
);

// A thousand SADD commands, adding three members each time
for($i=0;$i<1000;$i++) {
    $obj_mi->sadd('some-set', "$i-one", "$i-two", "$i-three");
}

// A thousand ZADD commands
for($i=0;$i<1000;$i++) {
    $obj_mi->zadd('some-zset', $i, "member-$i");
}

// Save the buffer
$obj_mi->SaveBuffer('test.buf');
?>

然后你可以这样做:

➜  tredismi  php mi.php
session id: some-session-id
buffer file: test.buf
commands   : 2000
➜  tredismi  cat test.buf|redis-cli --pipe
All data transferred. Waiting for the last reply...
Last reply received from server.
errors: 0, replies: 2000

干杯!